﻿SERIE CLASICE INFORMATICĂ C^PPTER Andrew S Tanenbaum ORGANIZARE STRUCTURATĂ A CALCULATELOR Ediția a cincea PH PTR Prentice Hali PTR Upper Saddle River, New Jersey www phptr com HARCCMHR INFORMATICĂ E TANENBAUM ARHITECTURA CALCULATORULUI EDIȚIA A V-A C^PPTER Moscova ■ Sankt Petersburg • Nijni Novgorod ■ Voronezh Novosibirsk - Rostov-pe-Don - Ekaterinburg • Samara Kiev ■ Harkov ■ Minsk BBK - UDC T Tanenbaum E T Arhitectura computerului a -a ed (+CD) - Sankt Petersburg: Peter, - p : ill ISBN - - - Cartea lui Andrew Tanenbaum, specialistul, scriitorul și profesorul de renume mondial în tehnologia informației, este acum la a cincea ediție, dedicată organizării structurale a computerului Se bazează pe ideea unei structuri ierarhice, în care fiecare nivel îndeplinește o funcție bine definită În cadrul acestei abordări neconvenționale, nivelul de logică digitală, nivelul arhitecturii de instrucțiuni, nivelul sistemului de operare și nivelul limbajului de asamblare sunt descrise în detaliu Cartea este destinată unei game largi de cititori: atât studenților care studiază tehnologia computerelor, cât și celor care se familiarizează în mod independent cu arhitectura computerelor BBK - UDC Drepturi de publicare obținute prin acord cu Prentice Hali PTR Toate drepturile rezervate Nicio parte a acestei cărți nu poate fi reprodusă sub nicio formă fără permisiunea scrisă a deținătorilor drepturilor de autor Informațiile conținute în această carte au fost obținute din surse considerate de către editor a fi de încredere Totuși, având în vedere eventualele erori umane sau tehnice, editorul nu poate garanta acuratețea și caracterul complet al informațiilor furnizate și nu este responsabil pentru eventualele erori asociate cu utilizarea cărții ISBN - - - ISBN - - - Copyright (c) Pearson Prentice Hali (c) Traducere în rusă, Peter Press LLC, (c) Ediție în limba rusă, design, Peter Press LLC, rezumat Cuvânt înainte Capitolul Introducere Capitolul Organizarea sistemelor informatice Capitolul Nivelul logic digital Capitolul Stratul de microarhitectură Capitolul Stratul de arhitectură al setului de instrucțiuni Capitolul Nivelul sistemului de operare Capitolul Nivel de asamblare Capitolul Arhitecturi de calculatoare paralele Capitolul Anexa A Numere binare Anexa B Numere în virgulă mobilă Anexa B Programare în limbaj de asamblare Lista de termeni Index alfabetic Conţinut Cuvânt înainte De la editorul traducerii Capitolul Introducere Organizarea calculatoarelor pe mai multe niveluri Limbi, niveluri și mașini virtuale Mașini moderne cu mai multe niveluri Dezvoltarea maşinilor cu mai multe niveluri Dezvoltarea arhitecturii calculatoarelor Generația Zero - Calculatoare mecanice ( - ) Prima generație - tuburi vidate ( - ) A doua generație - tranzistoare ( - ) A treia generație - circuite integrate ( - ) A patra generație - circuite integrate foarte mari ( -?) Generația a cincea - Calculatoare invizibile Tipuri de calculatoare Aspecte tehnologice și economice Gamă largă de calculatoare Calculatoare de unică folosinţă Microcontrolere Calculatoare de jocuri Calculatoare personale Servere Complexe de stații de lucru Mainframe Familii de calculatoare Pentium Prezentarea cipului UltraSPARC III Cunoașterea Unități Rezumatul cărții Întrebări și sarcini Capitolul Organizarea sistemelor informatice Procesoare Dispozitiv CPU Executarea comenzilor Sistemele RISC și CISC Principii de proiectare pentru calculatoare moderne Paralelism la nivel de instruire Paralelism la nivel de procesor memoria principala Pic Adrese de memorie Ordinea octetilor Cod de corectare a erorilor Cache Asamblarea modulelor de memorie și tipurile acestora Conţinut Memoria auxiliară Structura ierarhică a memoriei Discuri magnetice Dischete Discuri IDE Discuri SCSI Matrice RAID CD-ROM-uri Discuri CD-R Discuri CD-RW Discuri DVD Discuri Blu-Ray Intrare Ieșire Anvelope Terminale Memoria video Șoareci Imprimante Echipamente de telecomunicaţii Camere digitale Codurile de caractere Rezumatul capitolului Întrebări și sarcini Capitolul Nivelul logic digital Porțile și algebra booleană Supape Algebră booleană Implementarea funcţiilor booleene Echivalența schemei Circuite logice digitale de bază Circuite integrate Scheme combinatoare Scheme aritmetice Generatoare de ceas Memorie Încuietori Declanșatoare Registre Organizarea memoriei Cipurile de memorie RAM și ROM Chip-uri și magistrale de procesor CI-uri de procesor Anvelope pentru computer Lățimea anvelopei Sincronizarea magistralei Arbitrajul de autobuz Principii de funcționare a anvelopei Exemple de procesoare Pentium UltraSPARC III Exemple de anvelope Autobuz ISA Conţinut magistrală PCI PCI Express Bus USB Interfețe Chip-uri I/O Decodificarea adresei Rezumatul capitolului Întrebări și sarcini Capitolul Nivelul de microarhitectură Exemplu de microarhitectură Calea datelor Microinstrucțiuni Managementul microinstructiunilor - microarhitectura Mіs- Exemplu de arhitectură de set de instrucțiuni - IJVM Grămadă Model de memorie IJVM Set de comenzi IJVM Compilarea IJVM Exemplu de implementare a microarhitecturii Micro-instrucțiuni și înregistrarea acestora Implementarea IJVM utilizând microarhitectura Mіs- Proiectarea nivelului de microarhitectură Viteză și cost Scurtarea lungimii traseului Preaducerea instrucțiunilor din memorie - Microarhitectura Mis- Proiectare transportoare - microarhitectură Mіs- Conductă în șapte etape - microarhitectura Mіs- Îmbunătățirea performanței Cache Predicția de ramură Executarea cu schimbare de succesiune și înlocuire de registre Executarea speculativă Exemple de nivel de microarhitectură Microarhitectura procesorului Pentium Microarhitectura procesorului UltraSPARC III Cu Microarhitectura procesorului Comparație între procesoarele Pentium, UltraSPARC și Rezumatul capitolului Întrebări și sarcini Capitolul Stratul de arhitectură al setului de instrucțiuni Prezentare generală a nivelului de arhitectură a setului de instrucțiuni Proprietăţile nivelului arhitecturii setului de instrucţiuni Modele de memorie Registre Echipe Prezentare generală asupra nivelului arhitecturii setului de instrucțiuni Pentium Prezentare generală a stratului de arhitectură al setului de instrucțiuni UltraSPARC III Prezentare generală a nivelului de arhitectură al setului de instrucțiuni Tipuri de date Tipuri de date numerice Tipuri de date non-numerice Tipuri de date procesor Pentium Conţinut Tipuri de date ale mașinii UltraSPARC III Tipuri de date Formate de comenzi Criterii de proiectare a formatului de comandă Extensie opcode Formate de comandă ale procesorului Pentium Formate de comandă pentru procesorul UltraSPARC III formate de comandă Adresarea Moduri de adresare Adresare directă Adresare directă Adresa de înregistrare Adresarea indirectă a registrului Adresarea la index Adresarea indexului relativ Adresarea stivei Moduri de adresare în instrucțiunile de salt Ortogonalitatea codurilor operaționale și a modurilor de adresare Moduri de adresare ale procesorului Pentium Moduri de adresare ale procesorului UltraSPARC III moduri de adresare a procesorului Compararea modului de adresare Tipuri de comenzi Comenzi de mișcare a datelor Operații binare Operații unare Comparații și sărituri condiționate Comenzi de apel de procedură Managementul ciclului Comenzi I/O Instrucțiuni pentru procesorul Pentium Comenzi UltraSPARC III Comenzi Compararea seturi de comenzi Flux de control Fluxul de control secvenţial şi tranziţiile Proceduri Corutine Prinderea excepțiilor Întreruperi Turnul din Hanoi Rezolvarea problemei "Turnul din Hanoi" în asamblatorul Pentium Rezolvarea problemei "Turnul din Hanoi" în asamblatorul UltraSPARC III Arhitectură IA- și procesor Itanium Problemă Pentium Modelul ІА- - calcule cu paralelism explicit al instrucțiunilor Reducerea numărului de accesări la memorie Programarea echipei Reducerea numărului de sărituri condiționate - predicție Încărcare speculativă Rezumatul capitolului Întrebări și sarcini Conţinut Capitolul Nivelul sistemului de operare Memorie virtuala Paginare în memorie Implementarea paginare în memorie Apelarea paginilor la cerere și setul de lucru Politica de înlocuire a paginii Dimensiunea paginii și fragmentarea Segmentare Implementarea Segmentării Memorie virtuală Pentium Memoria virtuală UltraSPARC III Memoria virtuală și stocarea în cache Instrucțiuni I/O virtuale Fișiere Implementarea instrucțiunilor I/O virtuale Comenzi de gestionare a directorului Instrucţiuni virtuale pentru operare în paralel Modelarea procesului Starea cursei Sincronizarea unui proces folosind semafoare Exemple de sisteme de operare Familiarizare cu sistemele de operare UNIX și Windows XP Exemple de memorie virtuală Exemple de I/O virtuale Exemple de control al procesului Rezumatul capitolului Întrebări și sarcini Capitolul Nivelul de asamblare Introducere în asamblator Conceptul de asamblator Scopul asamblatorului Format de operator în asamblator Directive Macrocomenzi Definirea macro, apelul macro și extinderea macro Macro-uri cu parametri Caracteristici suplimentare Implementarea macro-urilor în asamblare Proces de asamblare Asamblare în două treceri Prima trecere A doua trecere Tabel de simboluri Compilarea și descărcarea Sarcini de conectare Structura modulului obiect Timpul de conectare și realocarea dinamică a memoriei Legătura dinamică Rezumatul capitolului Întrebări și sarcini Capitolul Paralelism intra-CPU Paralelism la nivel de instruire Conţinut unsprezece Multithreading intraprocesor Multiprocesoare cu un singur cip Coprocesoare Procesoare de rețea Procesoare multimedia Procesoare cripto Multiprocesoare Multiprocesoare și Multicalculatoare Semantica memoriei IIMA-multiprocesoare în arhitecturi multiprocesoare simetrice Multiprocesoare NUMA Multiprocesoare SOMA Multicomputere Rețele de comunicații Procesoare masiv paralele Cluster Computing Software de comunicații pentru mai multe calculatoare Planificare Memoria partajată la nivelul aplicației Performanță Calcularea distribuită Rezumatul capitolului Întrebări și sarcini Capitolul Bibliografie Lectură suplimentară Literatură introductivă și nespecială Organizarea sistemelor informatice Nivel logic digital Nivel de microarhitectură Nivelul arhitecturii setului de instrucțiuni Nivel de sistem de operare Nivel de asamblare Arhitecturi de calculatoare paralele Numere binare și cu virgulă mobilă Programare în limbaj de asamblare Lista alfabetică de referințe Anexa A Numere binare Numere de precizie finită Sisteme numerice poziționale Conversia numerelor dintr-un sistem numeric în altul Numere binare negative Aritmetică binară Întrebări și sarcini Anexa B Numerele cu virgulă flotantă Principii de reprezentare a numerelor în virgulă mobilă Standardul IEEE Întrebări și sarcini Anexa B Programare în limbaj de asamblare Noțiuni de bază Limbaj de asamblare Un mic program în limbaj de asamblare Conţinut Procesor Ciclul procesorului Registre de uz general Registre pointer Memorie și adresare Organizarea și segmentele memoriei Adresarea Setul de comenzi Mutarea, copierea și comenzile aritmetice Operații booleene, pe biți și de deplasare Operații de buclă și operații repetitive cu șir Instrucțiuni pentru săriți și apeluri Apeluri subrutine Apeluri de sistem și subrutine de sistem Observații finale despre seturile de comenzi Asamblator Introducere Asamblator As din setul ACK Câteva diferențe față de alți asamblatori Tracer Comenzi Tracer Etape pregătitoare Exemple Salut Lume Registre de uz general Apelarea instrucțiunilor și a registrelor pointerului Depanarea unui program de ieșire matrice Prelucrarea șirurilor de caractere și comenzile șirurilor Tabele de expediere Acces la fișiere în buffer și aleatoriu Întrebări și sarcini Lista termenilor Index alfabetic Suzanne, Barbara, Marvin, în memoria celor dragi mei și a lui Bram cuvânt înainte Primele patru ediții ale cărții se bazează pe ideea că computerul poate fi privit ca o ierarhie de niveluri, fiecare dintre ele îndeplinește o funcție specifică Această afirmație fundamentală este la fel de valabilă acum ca și când a fost publicată prima ediție, așa că o iau în continuare ca bază, de data aceasta în ediția a cincea La fel ca primele patru, acesta detaliază nivelul logicii digitale, precum și microarhitectura, arhitectura setului de instrucțiuni, sistemul de operare și nivelurile de asamblare În general, structura cărții a rămas aceeași, însă la cea de-a cincea ediție au fost aduse unele modificări, ceea ce se explică prin dezvoltarea rapidă a industriei computerelor Cartea folosește ca exemple mașini moderne Pentium de la Intel și Sun UltraSPARC III de la Sun, precum și un alt procesor Intel, Procesorul Pentium este popular în segmentul desktop În contrast, modelul UltraSPARC III este adesea instalat în sistemele de servere multiprocesor Probabil, mulți vor fi surprinși de alegerea procesorului ca exemplu Într-adevăr, acest microcircuit a fost folosit în industrie de câteva decenii Cert este că abia acum, în contextul dezvoltării rapide a sistemelor încorporate, potențialul poate fi considerat pe deplin realizat Microcontrolerele sunt acum instalate într-o varietate de dispozitive - de la ceasuri cu alarmă la cuptoare cu microunde Foarte des, este utilizat în aceste scopuri, ceea ce este asociat cu costul foarte scăzut al procesorului în sine, o selecție largă de programe și periferice și o mulțime de programatori calificați Mulți profesori care își construiesc cursurile în jurul acestei cărți mi-au cerut să dezvolt subiectul programarii în limbaj de asamblare În cea de-a cincea ediție, am ținut cont de dorințele lor - materialul relevant este în Anexa B Exemplele folosesc asamblatorul , care este o versiune simplificată a popularului asamblator Pentium Ai putea alege UltraSPARC assembler, MIPS sau un alt procesor despre care puțini oameni au auzit, dar are un avantaj important - majoritatea studenților lucrează acasă pe computere Pentium, iar programele scrise în assembler sunt compatibile cu aceste sisteme Deoarece depanarea codului de asamblare este foarte dificilă, am dezvoltat mai multe instrumente pentru a ajuta procesul de învățare, inclusiv asamblatorul în sine, precum și un simulator și un trasor Aceste instrumente funcționează în medii Windows, UNIX și Linux Sunt disponibile atât pe CD-ul însoțitor, cât și pe site-ul cărții Volumul cărții a crescut de-a lungul anilor Acest lucru este inevitabil deoarece există o dezvoltare constantă și se știe din ce în ce mai mult despre subiect Prin urmare, dacă cartea este folosită în scopuri educaționale, rețineți că acest curs poate dura mai mult decât înainte O posibilă opțiune este studierea primelor trei capitole, parte a capitolului (până la secțiunea cuvânt înainte Microarhitectura Level Development inclusiv) și Capitolul și petreceți timpul rămas la discreția dvs în Capitolele , și , precum și în a doua parte a Capitolului Următoarele modificări au fost aduse la cea de-a cincea ediție Capitolul continuă să acopere istoria arhitecturii computerelor, dar am extins lista de mașini acoperite Acest capitol include trei exemple de bază pentru procesoarele Pentium , UltraSPARC III și Capitolul a fost actualizat și revizuit În acesta, analizăm dispozitivele I/O moderne, concentrându-ne pe cele mai noi soluții tehnologice Printre tehnologiile luate în considerare se numără camerele digitale, liniile digitale de abonat, modemurile prin cablu Capitolul a fost reproiectat pentru a acoperi magistralele computerelor și dispozitivele I/O moderne Dispozitivul de microcircuite este ilustrat prin trei exemple noi S-a scris o nouă secțiune despre magistrala PCI Express, care după ceva timp probabil va înlocui complet magistrala PCI Capitolul , care conturează principiile de bază ale sistemelor de calcul, a rămas aproape neschimbat de la lansarea celei de-a patra ediții Include doar trei secțiuni noi la nivelul microarhitecturii procesoarelor Pentium , UltraSPARC III și Modificările din capitolele , și sunt legate în principal de exemple noi În Capitolul , în loc de Windows NT, materialul este explicat folosind Windows XP ca exemplu, dar modificările teoretice sunt minime Capitolul , dimpotrivă, a fost complet rescris, iar acum reflectă în mod adecvat dezvoltarea arhitecturilor de computere paralele Acesta ia în considerare cinci clase de sisteme paralele: sisteme cu paralelism intra-procesor (paralelism la nivel de instrucțiuni, multithreading intra-procesor, multiprocesoare cu un singur cip), coprocesoare, sisteme de memorie partajată, clustere și, pe scurt, sisteme de calcul distribuite Exemplele actuale abundă în acest capitol, în special procesorul TriMedia, precum și clusterele BlueGene/L , Red Storm și Google Lista referințelor din capitolul a suferit modificări semnificative Acest lucru este firesc, deoarece în domeniul nostru apare constant literatură nouă Mai mult de jumătate dintre citările citate în ediția a cincea se referă la lucrări publicate după ediția a patra Aplicațiile A și B nu s-au schimbat, dar a apărut o aplicație C complet nouă, dedicată programării în limbaj de asamblare Poate fi văzut ca un ghid miniatural de programare folosind instrumentele disponibile pe CD-ul însoțitor și pe site-ul cărții Anexa B este de Evert Wattel de la Universitatea Liberă din Amsterdam Are multă experiență în a învăța cum să lucreze cu instrumente de programare pentru asamblare și îi sunt foarte recunoscător pentru că și-a asumat această sarcină Pe lângă instrumentele de asamblare, site-ul are un program de simulare (un simulator grafic) conceput să lucreze cu materialul din capitolul , dezvoltat de profesorul Richard Salter de la Oberlin College Lui - mulțumiri speciale cuvânt înainte În cele din urmă, site-ul cărții la http://www prenhaU com/tanenbaum conține toate ilustrațiile cărții și prezentările PowerPoint pentru educatori După ce ați ajuns la adresa specificată, faceți clic pe linkul Companion Website și selectați pagina pe care o căutați din meniul care apare Educatorii care își organizează studiile universitare pe baza materialului din această carte pot obține de la reprezentanța Pearson Education un ghid metodologic care conține răspunsurile corecte la toate întrebările și soluțiile la toate problemele Autorul mulțumește sincer tuturor celor care au citit manuscrisul acestei cărți și au oferit comentarii, sugestii sau asistență valoroase în orice fel Multe mulțumiri lui Nikitas Alexandridis, Shekar Borkar, Herbert Bos, Scott Cannon, Doug Carmean, Alan Charlesworth, Eric Cota-Robles), Michael Fetterman, Quinn Jacobson, Thilo Kielmann, Iffat Kazi, Saul Levy, Ahmed Louri, Abijit Pandia (Abhijit Pandya) ), Krist Petersen, Mark Russinovici, Ronald Schroeder și Saim Ural Mulțumiri speciale lui Jim Goodman pentru contribuțiile sale la această carte (în special capitolele și ) Ideea de a folosi JVM-ul îi aparține Cartea s-a îmbunătățit mult datorită asistenței sale În cele din urmă, aș dori să îi mulțumesc lui Suzanne pentru dragostea și răbdarea ei neobișnuită Aceasta este deja a -a carte și suntem încă împreună! Mulțumesc Barbara și Marvin pentru că sunt copii atât de grozavi - acum știu ce fac profesorii pentru a-și câștiga existența În , Academia Regală Olandeză de Arte și Științe mi-a acordat statutul mult așteptat de academic, eliberându-mă astfel de îndatoririle cele mai puțin atractive ale unui muncitor universitar (de exemplu, de ședințele lungi și plictisitoare ale consiliului academic), pt pe care le sunt extrem de recunoscător respectaților mei colegi Andrew S Tanenbaum De la editorul traducerii Vă rugăm să trimiteți comentariile, sugestiile și întrebările dvs la comp@piter com (editura Peter, ediție computer) Ne-am bucura sa primim vesti de la tine! Pentru mai multe informații despre cărțile noastre, vă rugăm să vizitați site-ul web al editurii http://www piter com Capitolul Introducere Un computer digital este o mașină care poate rezolva probleme executând comenzile care îi sunt date O secvență de comenzi care descriu soluția unei anumite probleme se numește program Circuitele electronice ale fiecărui computer pot recunoaște și executa un set limitat de comenzi simple Toate programele înainte de execuție trebuie transformate într-o secvență de astfel de comenzi, care de obicei nu sunt mai complicate decât, de exemplu: ♦ adăugați numere; ♦ verifica dacă numărul nu este zero; ♦ copiați un bloc de date dintr-o parte a memoriei computerului în alta Aceste comenzi primitive constituie colectiv limbajul în care oamenii pot comunica cu un computer Un astfel de limbaj se numește limbaj mașină Proiectantul, atunci când creează un nou computer, trebuie să decidă ce comenzi să includă în limbajul mașinii acelui computer Depinde de scopul computerului și de sarcinile pe care trebuie să le rezolve Este obișnuit să încercați să faceți instrucțiunile mașinii cât mai simple posibil pentru a evita complexitatea proiectării computerului și pentru a reduce costul electronicelor necesare Majoritatea limbajelor de mașină sunt extrem de primitive, ceea ce face scrierea în ele atât dificilă, cât și plictisitoare Această observație simplă de-a lungul timpului a dus la construirea unui număr de niveluri de abstractizare, fiecare dintre acestea fiind construit pe deasupra unui nivel inferior de abstractizare Așa puteți depăși dificultățile când comunicați cu un computer Numim această abordare organizare computerizată pe mai multe niveluri În secțiunea următoare, vom explica ce înseamnă acest termen Apoi vom vorbi despre istoria dezvoltării problemei și starea de fapt în acest moment și vom analiza, de asemenea, câteva exemple importante Organizarea calculatoarelor pe mai multe niveluri După cum am spus deja, există o diferență uriașă între ceea ce este convenabil pentru oameni și ceea ce pot face computerele Oamenii vor să facă X, dar computerele pot face doar Y Acest lucru creează o problemă Scopul acestei cărți este de a explica cum se rezolvă această problemă Limbi, niveluri și mașini virtuale Problema de mai sus poate fi rezolvată în două moduri Ambele metode implică dezvoltarea de noi comenzi care sunt mai prietenoase cu oamenii decât cele încorporate Capitolul Introducere comenzile mașinii Aceste noi instrucțiuni formează în mod colectiv un limbaj, pe care îl vom numi Self Instrucțiunile mașinii încorporate formează, de asemenea, un limbaj și îl vom numi Self Un computer poate rula doar programe scrise în limbajul său de mașină, Self două moduri de rezolvare a problemei diferă prin aceea că modul în care computerul va executa programele scrise în limbajul Z , deoarece în final doar limbajul mașină Z este disponibil pentru computer Prima modalitate de a executa un program scris în Z este înlocuirea fiecărei instrucțiuni cu un set echivalent de instrucțiuni Z În acest caz, computerul execută noul program Z în loc de vechiul program Z Această tehnică se numește traducere A doua metodă înseamnă crearea unui program în limbajul I , care primește ca intrare programe scrise în limba I În acest caz, fiecare comandă a limbajului I este procesată pe rând, după care setul echivalent de comenzi din Imediat se execută limbajul I Această tehnologie nu necesită compilarea unui nou program pe R Se numește interpretare, iar programul care realizează interpretarea se numește interpret Există multe asemănări între traducere și interpretare În ambele abordări, computerul ajunge să execute un set de instrucțiuni Z echivalente cu instrucțiunile Z Singura diferență este că în timpul traducerii, întregul program Z este refăcut în Z , programul Z este aruncat și noul program Z este încărcat în memoria computerului și apoi executat La interpretare, fiecare comandă a programului din R este recodificată în R și imediat executată Spre deosebire de traducere, aici nu se creează un program nou în R , ci are loc codificarea secvențială și execuția comenzilor Din punctul de vedere al interpretului, un program L nu este altceva decât o intrare "brută" Ambele abordări sunt utilizate pe scară largă atât împreună, cât și separat Totuși, mai degrabă decât să ne gândim în termeni de traducere și interpretare, este mult mai ușor să ne imaginăm existența unui computer ipotetic sau a unei mașini virtuale pentru care limbajul mașinii este R Dacă o astfel de mașină M ar putea fi construită fără cheltuieli financiare mari, limbajul R și o mașină care execută programe în limbajul R nu ar fi necesare S-ar putea pur și simplu să scrie programe în R , iar computerul le-ar executa imediat Chiar dacă este posibil să nu fie posibilă crearea unei mașini virtuale (din cauza costurilor prohibitive sau a dificultăților de dezvoltare), oamenii pot scrie programe care o țintesc Aceste programe ar fi traduse sau interpretate de un program scris în limbajul Z , care ar putea fi executat în sine de un computer existent Cu alte cuvinte, puteți scrie programe pentru mașini virtuale ca și cum aceste mașini ar exista cu adevărat Traducerea și interpretarea sunt utile numai dacă limbile I și I nu diferă prea mult una de cealaltă Aceasta înseamnă că limbajul I , deși mai bun decât I , este încă departe de ideal Poate că acest lucru este oarecum descurajator Organizarea calculatoarelor pe mai multe niveluri în lumina obiectivului inițial de a crea limbajul I - eliberarea programatorului de povara scrierii programelor într-un limbaj ușor de înțeles pentru un computer, dar puțin adaptat unei persoane Cu toate acestea, situația nu este atât de fără speranță Soluția evidentă a problemei este crearea unui alt set de comenzi care sunt mai orientate spre om și mai puțin orientate către computer decât R Acest al treilea set de instrucțiuni formează și limbajul, pe care îl vom numi R , și mașina virtuală corespunzătoare, M O persoană poate scrie programe în H ca și cum ar exista o mașină virtuală pentru a lucra cu limbajul de mașină H Astfel de programe pot fi fie traduse în L , fie executate de un interpret scris în L Invenția unei serii întregi de limbi, fiecare mai prietenos cu oamenii decât precedentul, poate continua până când ajungem la o limbă care ni se potrivește Fiecare astfel de limbă folosește predecesorul său ca bază, așa că ne putem gândi la computer ca la o serie de straturi, prezentate în Fig Limba din partea de jos a structurii ierarhice este cea mai primitivă, iar limbajul de sus este cel mai complex Nivel p Nivelul Nivelul Nivelul Nivelul O Programele în limbajul R sunt fie interpretate de un program interpret care rulează pe o mașină de nivel inferior, fie traduse în limbajul de mașină al unei mașini de nivel inferior Programele în limba I sunt fie interpretate de programele interpret care rulează pe mașina M sau M , fie traduse în I sau I O Programele din limba Z sunt fie interpretate de un program interpret care rulează pe mașina M , fie traduse în ZO Programele I sunt executate direct de circuite electronice Orez mașină stratificată Există o relație importantă între limbaj și mașina virtuală Fiecare mașină acceptă un anumit limbaj de mașină, constând din toate comenzile pe care această mașină le poate executa În esență, mașina determină limbajul În mod similar, limbajul definește o mașină care poate Capitolul Introducere execută toate programele scrise în limba respectivă Este foarte dificil și costisitor să construiești o mașină definită de un limbaj sau altul din circuite electronice, dar ne putem imagina o astfel de mașină Un computer care să ruleze limbajul de mașină C sau C++ ar fi prea complex, dar în principiu unul poate fi dezvoltat având în vedere nivelul ridicat al tehnologiei actuale Cu toate acestea, există motive întemeiate pentru a nu construi un astfel de computer - este o soluție extrem de ineficientă în comparație cu altele Într-adevăr, tehnologia trebuie să fie nu numai fezabilă, ci și rațională Un computer cu n niveluri poate fi considerat ca n mașini virtuale diferite, fiecare cu propriul limbaj de mașină Vom folosi termenii "strat" și "mașină virtuală" ca sinonime Doar programele scrise în Z pot fi executate de un computer fără traducere sau interpretare Programele scrise în Z , Z , , Zn trebuie să treacă printr-un interpret de nivel inferior sau să fie traduse într-o limbă corespunzătoare unui nivel inferior O persoană care scrie programe pentru o mașină virtuală de nivel n nu trebuie să știe despre traducători și interpreți de niveluri inferioare Mașina va executa aceste programe, indiferent dacă sunt puse în scenă de interpret sau procesate de mașina în sine În ambele cazuri, rezultatul este același - este execuția programului Majoritatea programatorilor care folosesc o mașină de nivel n sunt interesați doar de nivelul superior, care este cel mai puțin asemănător cu limbajul mașinii Cu toate acestea, cei care doresc să înțeleagă cum funcționează de fapt un computer trebuie să învețe toate nivelurile Dezvoltatorii de noi computere sau de noi niveluri (adică noi mașini virtuale) ar trebui, de asemenea, să fie familiarizați cu toate nivelurile Conceptele și tehnicile de dezvoltare a mașinilor ca sistem de niveluri, precum și o descriere detaliată a acestor niveluri, constituie subiectul principal al acestei cărți Mașini moderne pe mai multe niveluri Majoritatea computerelor moderne constau din două sau mai multe straturi Există chiar și mașini cu șase nivele (Fig ) Nivelul este hardware-ul mașinii Circuitele electronice de la nivelul execută programe dependente de mașină De dragul completității, este necesar să menționăm existența unui alt nivel, care este situat sub zero Acest nivel nu este prezentat în fig , deoarece intră în domeniul ingineriei electronice și, prin urmare, nu este acoperit în această carte Se numește stratul dispozitivului fizic La acest nivel, există tranzistori, care sunt primitive pentru dezvoltatorii de computere Explicarea modului în care funcționează tranzistorii este sarcina fizicii La cel mai de jos nivel pe care îl vom studia, și anume nivelul logicii digitale, obiectele se numesc porți Deși porțile sunt formate din componente analogice, cum ar fi tranzistoarele, ele pot fi modelate cu precizie ca dispozitive digitale Fiecare poartă are una sau mai multe intrări digitale (semnale reprezentând sau ) Poarta calculatorului Organizarea calculatoarelor pe mai multe niveluri Oferă funcții simple ale acestor semnale, cum ar fi AND sau SAU Fiecare poartă este formată din mai mulți tranzistori Mai multe porți formează bit de memorie, care poate conține sau Biții de memorie, combinați în grupuri, de exemplu, , sau , formează registre Fiecare registru poate deține un număr binar până la o anumită limită Gates poate alcătui și computerul în sine Porțile și nivelul logicii digitale vor fi tratate în detaliu în Capitolul Nivelul Nivelul Nivelul Nivelul Nivelul Nivelul O Orez Calculator cu șase niveluri Modul în care este suportat fiecare nivel este listat sub acesta, între paranteze este numele software-ului corespunzător Următorul nivel se numește nivelul de microarhitectură La acest nivel, există seturi de sau de registre care formează memoria locală și un circuit numit ALU (unitate logică aritmetică) ALU efectuează operații aritmetice simple Registrele, împreună cu ALU, formează calea de date prin care sunt primite datele Calea datelor funcționează după cum urmează Sunt selectați unul sau două registre, ALU efectuează o operațiune asupra lor, cum ar fi adăugarea, după care rezultatul este plasat din nou într-unul dintre aceste registre Pe unele mașini, funcționarea căii de date este controlată de un program special numit firmware Pe alte mașini, calea datelor este controlată de hardware În primele trei ediții ale cărții, am numit acest nivel "nivel de microprogramare", deoarece în trecut conținea aproape întotdeauna un interpret software Deoarece calea datelor este acum controlată de obicei de hardware, am schimbat numele pentru a reflecta mai bine sensul Capitolul Introducere Pe mașinile în care calea datelor este controlată de software, firmware-ul este interpretul pentru comenzile de la nivelul Firmware-ul apelează comenzile din memorie și le execută una câte una folosind calea datelor De exemplu, atunci când o instrucțiune ADD este executată, este apelată din memorie, operanzii săi sunt plasați în registre, ALU calculează suma și apoi rezultatul este trimis înapoi Pe un computer cu control hardware al căii de date, are loc aceeași procedură, dar nu există niciun program care să interpreteze comenzile de nivel Nivelul va fi denumit nivelul arhitecturii setului de instrucțiuni Fiecare producător publică un manual pentru calculatoarele pe care le vinde, numit "Manualul Limbajului X al Mașinii", "Principii Computer Y", etc Un astfel de manual conține informații despre acest nivel Setul de instrucțiuni ale mașinii descrise în acesta este de fapt executat de firmware-ul sau hardware-ul interpretului Dacă un producător furnizează doi interpreți pentru aceeași mașină, acesta trebuie să publice două manuale în limbajul mașinii, separat pentru fiecare interpret Următorul nivel este de obicei hibrid Majoritatea comenzilor din limba sa se află și la nivelul arhitecturii setului de instrucțiuni (comenzile care sunt disponibile la unul dintre niveluri pot fi foarte bine reprezentate la alte niveluri) Acest nivel are câteva caracteristici suplimentare: un nou set de instrucțiuni, o organizare diferită a memoriei, capacitatea de a executa două sau mai multe programe în același timp și altele Când construiți nivelul , sunt posibile mai multe opțiuni decât atunci când construiți nivelurile și Noile caracteristici introduse la nivelul sunt executate de interpretul care rulează la nivelul Acest interpret a fost numit cândva sistemul de operare Comenzile de nivel , care sunt identice cu comenzile de nivelul , sunt executate de firmware sau hardware, nu de sistemul de operare Cu alte cuvinte, o parte a comenzilor de nivel este interpretată de sistemul de operare, iar cealaltă parte este interpretată de firmware De aceea acest nivel este considerat hibrid Ne vom referi la acest strat drept stratul sistemului de operare Există o diferență semnificativă între nivelurile și Cele trei niveluri de jos nu sunt menite să fie gestionate de programatorul obișnuit Aceștia sunt inițial vizați de interpreți și traducători care sprijină niveluri superioare Aceste compilatoare și interpreți sunt compilate de așa-numiții programatori de sistem care sunt specializați în dezvoltarea de noi mașini virtuale Nivelurile patru și mai mari sunt pentru programatorii de aplicații care rezolvă probleme specifice O altă modificare introdusă la nivelul este mecanismul de sprijinire a nivelurilor superioare Nivelurile și sunt de obicei interpretate, în timp ce nivelurile , și mai sus sunt de obicei difuzate, deși nu întotdeauna O altă diferență între nivelurile , , și nivelurile , și mai sus este o caracteristică a limbii Limbajele mașinii de nivel , și sunt digitale Programele scrise în aceste limbi sunt alcătuite din șiruri lungi de numere care sunt înțelese de computere, dar nu sunt ușor de înțeles de oameni Începând de la nivelul , limbile conțin cuvinte și abrevieri care pot fi înțelese de oameni Organizarea calculatoarelor pe mai multe niveluri Nivelul este o formă simbolică a uneia dintre limbile de nivel inferior La acest nivel, este posibil să scrieți programe într-o formă care poate fi citită de om Aceste programe sunt mai întâi traduse într-un limbaj de nivel , sau și apoi interpretate de mașina virtuală sau reală corespunzătoare Programul care face traducerea se numește asamblator Nivelul constă de obicei din limbaje concepute pentru programatorii de aplicații Astfel de limbi sunt numite limbi de nivel înalt Există sute de limbi de nivel înalt Cele mai cunoscute dintre ele sunt C, C++, Java, LISP și Prolog Programele scrise în aceste limbi sunt de obicei traduse la nivelul sau Compilatoarele care procesează aceste programe se numesc compilatoare Rețineți că uneori există și o interpretare De exemplu, programele Java sunt mai întâi traduse într-un limbaj similar cu ISA numit Java bytecode, care este apoi interpretat În unele cazuri, stratul constă dintr-un interpret pentru o anumită zonă de aplicație, cum ar fi logica simbolică Oferă date și operații pentru rezolvarea problemelor din acest domeniu, exprimate folosind terminologie specială Astfel, computerul este conceput ca o structură ierarhică de niveluri care sunt construite unul peste altul Fiecare nivel este o abstractizare specifică a diferitelor obiecte și operații Tratând computerul în acest fel, putem omite detaliile de care nu avem nevoie și astfel facem un subiect complex mai ușor de înțeles Setul de tipuri de date, operațiuni și caracteristici ale fiecărui strat individual se numește arhitectură Arhitectura este legată de aspectele software De exemplu, cunoașterea câtă memorie poate fi utilizată la scrierea unui program face parte din arhitectură Aspectele de implementare (cum ar fi tehnologia utilizată pentru implementarea memoriei) nu fac parte din arhitectură Studiind metodele de proiectare a elementelor software ale unui sistem informatic, studiem arhitectura computerului În practică, termenii "arhitectura computerului" și "organizarea computerului" sunt folosiți în mod interschimbabil Dezvoltarea de mașini cu mai multe niveluri În această secțiune, descriem pe scurt istoria dezvoltării mașinilor cu mai multe niveluri, arătând modul în care numărul și natura nivelurilor s-au schimbat de-a lungul anilor Programele scrise în limbaj mașină (nivelul ) pot fi executate imediat fără utilizarea interpreților și traducătorilor de către circuitele electronice ale computerului (nivel ) Aceste circuite electronice, împreună cu memoria și I/O, formează hardware-ul Hardware-ul este alcătuit din obiecte tangibile, cum ar fi circuite integrate, plăci de circuite imprimate, cabluri, surse de alimentare, module de memorie și imprimante Conceptele abstracte, algoritmii și comenzile nu se aplică hardware-ului Capitolul Introducere Software-ul, în schimb, constă din algoritmi (secvențe detaliate de comenzi care descriu cum se rezolvă o problemă) și reprezentările lor pe computer, adică programe Programele pot fi stocate pe un hard disk, dischetă, CD sau alte medii, dar acest lucru nu este atât de important; în esență, software-ul este setul de instrucțiuni care alcătuiesc programele, nu mediul fizic pe care sunt stocate acele programe În primele computere, granița dintre hardware și software era clară Cu toate acestea, de-a lungul timpului, a existat o estompare semnificativă a acestei granițe, în primul rând datorită faptului că, în cursul dezvoltării computerelor, nivelurile au fost adăugate, eliminate și fuzionate unele cu altele În prezent, este foarte greu să le separăm unele de altele [ ] Legat de această problemă este tema centrală a cărții noastre: Hardware-ul și software-ul sunt echivalente din punct de vedere logic Orice operațiune efectuată de software poate fi implementată de hardware (de preferință după ce a fost gândită) Karen Panetta Lentz a spus: "Hardware-ul este doar un software pietrificat" Desigur, este adevărat și invers: orice instrucțiune executată de hardware poate fi simulată de software Decizia de a separa caracteristicile hardware și software se bazează pe factori precum costul, performanța, fiabilitatea și frecvența modificărilor așteptate Există câteva reguli stricte și rapide conform cărora operațiunea X trebuie implementată în hardware și operațiunea Y trebuie programată Aceste decizii se modifică în funcție de tendințele de dezvoltare economică și tehnologică Invenția microprogramării Primele calculatoare digitale din anii aveau doar două straturi: stratul arhitecturii setului de instrucțiuni care făcea programare și stratul logic digital care executa programele Circuitele de nivel logic digital au fost nesigure, greu de produs și de înțeles În , Maurice Wilkes, cercetător la Universitatea din Cambridge, a propus ideea dezvoltării unui computer cu trei niveluri pentru a simplifica hardware-ul [ ] Această mașină trebuia să aibă încorporat un interpret imuabil (firmware) a cărui funcție era să execute programe la nivel ISA prin interpretare Deoarece hardware-ul trebuia să ruleze acum doar microprograme cu un set limitat de instrucțiuni în loc de programe la nivel ISA, erau necesare mai puține circuite electronice Întrucât circuitele electronice erau apoi realizate din tuburi vidate, această simplificare a avut scopul de a reduce numărul de tuburi și, prin urmare, de a crește fiabilitatea (care la acea vreme era exprimată în numărul de defecțiuni pe zi) În anii , au fost construite mai multe mașini cu trei niveluri În anii , numărul acestor mașini a crescut semnificativ În anii , ideea că un program scris ar trebui mai întâi interpretat de microprogram, mai degrabă decât executat direct de electronică, a devenit răspândită Organizarea calculatoarelor pe mai multe niveluri Invenția sistemului de operare În acele vremuri, când au apărut computerele, principiile de lucru cu ele erau foarte diferite de cele moderne Un computer a fost folosit de un număr mare de oameni Lângă mașină era o bucată de hârtie și, dacă un programator dorea să-și ruleze programul, se înscrie pentru o anumită oră, să zicem miercuri de la : la : (multor programatori le plăcea să lucreze în tăcere) La ora stabilită, programatorul s-a dus în camera în care se afla aparatul, cu un pachet de cărți perforate (care serveau apoi ca mijloc de introducere) într-o mână și un creion bine ascuțit în cealaltă Fiecare carte perforată conținea de coloane; au fost perforate în el în anumite locuri Intrând în cameră, programatorul i-a cerut politicos programatorului anterior să-și facă loc și s-a apucat de treabă Dacă dorea să ruleze un program FORTRAN, trebuia să treacă prin următorii pași: S-a dus la dulapul unde se afla biblioteca de programe, a luat un teanc mare verde de cărți perforate cu inscripția "Fortran Compiler", le-a așezat în cititor și a apăsat butonul "Start" A pus un teanc de cărți cu programul său FORTRAN în cititor și a apăsat butonul "Continuare" Programul a fost citit Când computerul a încetat să funcționeze, programatorul și-a citit programul a doua oară Unele compilatoare necesitau doar o citire a cardurilor perforate, dar în majoritatea cazurilor a fost necesar să se efectueze această procedură de mai multe ori De fiecare dată a fost necesar să se numere un teanc mare de cărți perforate În cele din urmă emisiunea s-a încheiat Programatorul a devenit adesea foarte nervos, deoarece, dacă compilatorul a găsit o eroare în program, trebuia să o corecteze și să înceapă din nou procesul de intrare în program Dacă nu existau erori, compilatorul producea un program în limbajul mașinii sub formă de carduri perforate Apoi programatorul a introdus acest program în limbajul mașinii în cititor împreună cu un pachet de carduri perforate din biblioteca de subrutine și a încărcat ambele programe Execuția programului a început De cele mai multe ori nu a mers, oprindu-se pe neasteptate la mijloc De obicei, în acest caz, programatorul începea să tragă întrerupătoarele de pe consolă și se uita la becurile Dacă avea noroc, găsea și corecta eroarea, mergea la dulap, care conținea un teanc mare de cărți perforate verzi cu inscripția FORTRAN Compiler și începea totul de la capăt Dacă nu reușește, imprima conținutul memoriei, care se numea descărcare RAM, și ducea imprimarea acasă pentru studiu Această procedură este comună de mulți ani Programatorii au trebuit să învețe cum să lucreze cu mașina și ce să facă dacă se defecta, iar acest lucru se întâmpla destul de des Mașina este în mod constant Capitolul Introducere zăceau inactiv în timp ce oamenii transportau cărți perforate prin cameră sau se nedumeri de ce nu funcționa programul În anii , un bărbat a încercat să accelereze lucrurile prin automatizarea muncii operatorului Un program numit sistem de operare a fost încărcat în computer pe durata funcționării acestuia Programatorul a adus un pachet de carduri perforate cu un program specializat care a fost executat de sistemul de operare Pe fig Figura prezintă un model al unui pachet de carduri perforate pentru primul sistem de operare FMS (FORTRAN Monitor System) răspândit pentru computerul IBM *JOB, , BARBARA *XEQ *FORTRAN Program în limbaj - = ) // Dacă data lock=-l, atunci nu există operand data=memoryEdata loc]; // Apel de date execute(instr type,data): // Executați comanda } } private static int get instr type(int adresa) { } private static int find data(int instr, int tip) { } private static void execute(int tip, int date) { } Procesoare Însuși faptul că se poate scrie un program care simulează funcționarea unei unități centrale de procesare arată că programul nu trebuie să fie executat de un procesor (dispozitiv) real Dimpotrivă, un alt program poate apela din memorie, poate determina tipul de comenzi și poate executa aceste comenzi Un astfel de program se numește interpret Am vorbit despre interpreți în capitolul Programele de interpret care imită funcționarea unui procesor sunt utilizate pe scară largă în dezvoltarea sistemelor informatice După ce dezvoltatorul a ales un limbaj de mașină (I) pentru un nou computer, el trebuie să decidă dacă să dezvolte un procesor care să execute programe în limbajul I, sau să scrie un program special pentru interpretarea programelor în aceeași limbă Dacă decide să scrie un interpret, va trebui să dezvolte hardware-ul pentru a rula acel interpret Proiectele hibride sunt de asemenea posibile, atunci când unele comenzi sunt executate de hardware, iar unele sunt interpretate Interpretul împarte comenzile în comenzi mai mici (elementare) Ca rezultat, o mașină proiectată să ruleze un interpret poate fi mult mai simplă și mai ieftină decât un procesor care rulează programe fără interpretare Astfel de economii sunt deosebit de importante cu un număr mare de comenzi complexe cu parametri diferiți În esență, economiile provin din însuși faptul de a înlocui hardware-ul cu un program (interpret) Primele computere acceptau un număr mic de comenzi, iar aceste comenzi erau simple Cu toate acestea, dezvoltarea unor computere mai puternice a dus, printre altele, la apariția unor comenzi mai complexe Dezvoltatorii și-au dat seama curând că, cu comenzi complexe, programele rulează mai repede, deși fiecare comandă individuală durează mai mult (Exemplele de astfel de instrucțiuni complexe includ efectuarea de operații în virgulă mobilă, furnizarea de acces direct la elementele matricei și așa mai departe ) Dacă s-a constatat că o pereche de instrucțiuni particulare sunt executate frecvent secvențial, a fost introdusă o nouă instrucțiune pentru a le înlocui pe acestea două Comenzile complexe erau, de asemenea, mai bune, deoarece unele operațiuni se suprapuneau uneori Astfel de operațiuni puteau fi efectuate în paralel, dar aceasta necesita echipament suplimentar Pentru computerele scumpe, de înaltă performanță, acest hardware suplimentar a meritat să fie cumpărat Astfel, computerele scumpe aveau mult mai multe comenzi decât cele ieftine Cu toate acestea, evoluțiile în software-ul și cerințele de compatibilitate a comenzilor au condus la faptul că comenzile complexe au fost utilizate în computerele cu costuri reduse, deși costul a fost în prim-plan, nu viteza Până la sfârșitul anilor , IBM, care era pe atunci lider pe piața calculatoarelor, a decis că producția unei familii de calculatoare, fiecare dintre ele executând aceleași comenzi, este mai profitabilă pentru companie însăși și pentru clienți Pentru a caracteriza acest nivel de interoperabilitate, IBM a inventat termenul de arhitectură Noua familie de calculatoare trebuia să aibă o singură arhitectură și multe modele diferite, diferite ca preț și viteză, dar "capabile" să ruleze aceleași programe Dar cum să construiești un ieftin Capitolul Organizarea sistemelor informatice un computer care poate executa toate comenzile complexe pe care le au mașinile scumpe de înaltă performanță? Soluția a fost interpretarea Această tehnologie, propusă pentru prima dată de Wilkes în , a permis dezvoltarea unor calculatoare simple, cu costuri reduse, care încă puteau executa un număr mare de instrucțiuni Drept urmare, IBM a creat arhitectura System/ , o familie de computere compatibile care diferă ca preț și performanță Hardware-ul care i-a permis să funcționeze fără interpretare a fost folosit doar la cele mai scumpe modele Calculatoarele simple cu interpreți de comandă aveau meritele lor Cele mai importante dintre ele au fost: + capacitatea de a corecta comenzi executate incorect sau chiar de a compensa erorile hardware; + capacitatea de a adăuga comenzi noi la costuri minime și, dacă este necesar, după cumpărarea unui computer; + capacitatea (datorită unei organizații structurate) de a dezvolta, testa și documenta comenzi complexe În anii , piața calculatoarelor a crescut rapid, calculatoarele noi puteau îndeplini din ce în ce mai multe funcții Cererea de calculatoare ieftine a stimulat crearea de calculatoare cu interpreți Capacitatea de a dezvolta hardware cu un interpret pentru un anumit set de instrucțiuni a condus la procesoare ieftine Tehnologia semiconductoarelor s-a dezvoltat rapid, costul scăzut a prevalat asupra performanței înalte, iar interpreții au început să fie utilizați din ce în ce mai mult în dezvoltarea computerelor Interpretarea a fost folosită în aproape toate computerele lansate în anii , de la minicalculatoare până la cele mai mari mașini Până la sfârșitul anilor , interpreții au început să fie utilizați în aproape toate modelele, cu excepția celor mai scumpe mașini cu performanțe foarte ridicate (de exemplu, Crau- și calculatoarele din seria Control Data Cyber ) Interpreții au asigurat implementarea instrucțiunilor complexe fără utilizarea hardware-ului costisitor, astfel încât dezvoltatorii puteau introduce instrucțiuni din ce în ce mai complexe și, de asemenea, (și chiar mai ales) extinde modul în care erau definiți operanzii Această tendință a atins apogeul cu computerul VAX dezvoltat de DEC; avea câteva sute de instrucțiuni și peste de moduri de a defini operanzii din fiecare instrucțiune Din păcate, arhitectura VAX a fost concepută cu un interpret în minte încă de la început, cu puțină atenție acordată performanței Acest lucru a dus la apariția unui număr mare de comenzi de importanță secundară, care erau greu de implementat direct Această omisiune a fost fatală atât pentru VAX, cât și pentru producătorul său (DEC) Compaq a cumpărat DEC în (deși Compaq a devenit parte a Hewlett-Packard trei ani mai târziu) Deși primele microprocesoare pe biți erau foarte simple și suportau un set mic de instrucțiuni, până la sfârșitul anilor chiar și ele au început să fie dezvoltate cu o orientare pentru interpret În această perioadă, principala problemă pentru dezvoltatori a fost complexitatea tot mai mare a microprocesoarelor Procesoare Principalul avantaj al interpretării a fost că a fost posibil să se dezvolte un procesor foarte simplu și să se implementeze toate cele mai complexe folosind un interpret Astfel, în loc să se dezvolte hardware complex, a fost necesar să se dezvolte un software complex Succesul sistemului Motorola cu un set mare de instrucțiuni interpretabile și eșecul simultan al computerului Zilog Z , care avea un set la fel de mare de instrucțiuni, dar fără interpret, au demonstrat beneficiile interpretării în dezvoltarea de noi mașini Acest succes a fost destul de neașteptat, având în vedere că computerul Z (predecesorul lui Zilog Z ) a fost mai popular decât Motorola (predecesorul lui Motorola ) Bineînțeles, și alți factori au jucat un rol important, cum ar fi faptul că Motorola a fost în afacerea cu cipuri de mulți ani, iar marca Zilog era deținută de Exxon, o mare companie petrolieră Un alt factor în favoarea interpretării este existența unor dispozitive de memorie de mare viteză, doar în citire, pentru stocarea interpreților (așa-numitele ROM-uri de comandă) Să presupunem că pentru a executa o instrucțiune interpretată normală, interpretul computerului Motorola trebuie să execute instrucțiuni (se numesc microinstrucțiuni), câte ns fiecare și să facă accesări RAM, de ns fiecare Timpul total de execuție pentru instrucțiune ar fi, prin urmare, de ns, doar de două ori mai mult decât ar dura în cel mai bun caz execuția directă a acestei instrucțiuni fără interpretare Și dacă nu ar exista o memorie specială de mare viteză doar pentru citire, execuția acestei instrucțiuni ar dura până la ns Astfel, semnificația ROM-urilor de comandă este evidentă Sisteme RISC și CISC La sfârșitul anilor , au existat multe experimente cu comenzi foarte complexe, care au fost posibile prin interpretare Dezvoltatorii au încercat să reducă decalajul dintre ceea ce pot face computerele și ceea ce necesită limbajele de nivel înalt Aproape nimeni nu s-a gândit atunci să dezvolte mașini mai simple, la fel de puțini oameni (din păcate) dezvoltă acum sisteme de operare, rețele, editori, etc La IBM, această tendință a fost contracarată de un grup de dezvoltatori condus de John Cock (John Sosuke); au încercat să întruchipeze ideile lui Seymour Cray prin crearea unui minicomputer experimental de înaltă performanță arhitecturi În , o echipă de dezvoltare de la Universitatea Berkeley condusă de David Patterson și Carlo Sequin a început dezvoltarea procesoarelor VLSI non-interpretative [ , ] Pentru a desemna acest concept, au inventat termenul RISC și noul procesor Capitolul Organizarea sistemelor informatice numit RISC I, care a fost urmat în curând de RISC II Puțin mai târziu, în , John Hennesy de la Stanford a proiectat și produs un alt cip, pe care l-a numit MIPS [ ] Aceste două cipuri s-au dezvoltat în produse SPARC și, respectiv, MIPS importante din punct de vedere comercial Noile procesoare erau semnificativ diferite de procesoarele comerciale ale vremii Deoarece erau incompatibile cu produsele existente, dezvoltatorii au fost liberi să includă noi seturi de instrucțiuni care ar putea îmbunătăți performanța generală a sistemului Inițial, accentul s-a pus pe comenzi simple care puteau fi executate rapid Cu toate acestea, dezvoltatorii și-au dat seama curând că cheia pentru performanța înaltă a computerului era să dezvolte comenzi care să poată fi executate rapid Adică nu este atât de important cât timp se execută cutare sau cutare comandă, mai important este câte comenzi pe secundă pot fi lansate La momentul în care au fost dezvoltate aceste procesoare simple, un număr relativ mic de instrucțiuni (de obicei în jur de ) a atras atenția tuturor Pentru comparație, numărul de instrucțiuni din calculatoarele VAX fabricate de DEC și computerele mari fabricate de IBM la acea vreme a variat între și Calculatorul RISC (Reduced Set Instruction Computer) era opus sistemului CISC (Complex Instruction Set Computer) set de instructiuni) Un exemplu de mașină CISC este computerul VAX, care domina mediul universitar la acea vreme Până în prezent, puțini oameni cred că principala diferență dintre RISC și CISC este numărul de echipe, dar numele sunt încă păstrate Din acel moment, a început un război ideologic grandios între susținătorii RISC și dezvoltatorii mainframe-urilor VAX, Intel și IBM Potrivit primei, cel mai bun mod de a proiecta calculatoare este de a include un număr mic de instrucțiuni simple, fiecare dintre ele executată într-un ciclu al căii de date (vezi Fig ), adică efectuează o operație aritmetică sau logică pe o pereche de registre (de exemplu, adăugare sau o operație logică AND) și plasează rezultatul înapoi într-un registru Ca argument, ei au susținut că, chiar dacă sistemul RISC trebuie să execute sau instrucțiuni în loc de cea pe care o execută CISC, RISC tot câștigă în viteză, deoarece instrucțiunile RISC se execută de ori mai repede (pentru că nu sunt interpretate) De asemenea, trebuie remarcat faptul că până în acest moment viteza memoriei principale s-a apropiat de viteza ROM-urilor de comandă speciale, astfel încât defectele de interpretare au fost evidente, ceea ce a crescut și mai mult popularitatea computerelor RISC Având în vedere avantajele de performanță ale RISC, ne-am aștepta ca computere precum Alpha de la DEC să domine piața față de computerele CISC (Pentiums, etc ) Cu toate acestea, nu s-a întâmplat nimic de acest fel Se pune întrebarea: de ce? În primul rând, calculatoarele RISC nu sunt compatibile cu alte modele și multe companii au investit miliarde de dolari în software pentru produsele Intel În al doilea rând, destul de ciudat, Intel a reușit să implementeze aceleași idei în arhitectura CISC Procesoarele Intel care incep cu procesorul contin Procesoare Un nucleu RISC care execută cele mai simple (și de obicei cele mai comune) instrucțiuni într-un singur ciclu de cale a datelor, în timp ce tehnologia convențională CISC interpretează instrucțiuni mai complexe Drept urmare, comenzile comune sunt executate rapid, în timp ce cele mai complexe și rare sunt lente Deși performanța este mai mică cu această abordare "hibridă" decât cu arhitectura RISC, noua arhitectură CISC are o serie de avantaje, deoarece permite utilizarea software-ului mai vechi fără modificări Principii de proiectare pentru calculatoare moderne Au trecut mai bine de douăzeci de ani de când au fost construite primele calculatoare RISC, dar unele principii ale funcționării acestora pot fi adoptate având în vedere stadiul actual al tehnologiei de dezvoltare hardware Dacă există o schimbare foarte drastică în tehnologie (de exemplu, un nou proces de fabricație face ca timpul de acces la memorie de ori mai rapid decât timpul de acces la CPU), toate condițiile se schimbă Prin urmare, designerii ar trebui să ia în considerare întotdeauna posibilele schimbări tehnologice care ar putea afecta echilibrul dintre componentele computerului Există o serie de principii de proiectare, denumite uneori principii RISC, pe care producătorii de procesoare de uz general încearcă să le urmeze ori de câte ori este posibil Din cauza unor constrângeri externe, cum ar fi cerința de compatibilitate cu alte mașini, trebuie să faceți compromisuri din când în când, dar aceste principii sunt scopul pentru care se străduiesc majoritatea dezvoltatorilor + Toate comenzile trebuie executate direct de hardware Adică, comenzile normale nu sunt interpretate de micro-comenzi Eliminarea stratului de interpretare îmbunătățește viteza de execuție a majorității comenzilor În calculatoarele CISC, instrucțiunile mai complexe pot fi împărțite în mai multe etape, care sunt apoi executate ca o secvență de microinstrucțiuni Această operațiune suplimentară încetinește mașina, dar poate fi folosită pentru comenzi care sunt rar utilizate + Computerul ar trebui să execute cât mai multe comenzi pe secundă Calculatoarele moderne folosesc multe moduri diferite de a îmbunătăți performanța, principala fiind să ruleze cât mai multe comenzi pe secundă Procesorul -MIPS este capabil să ruleze de milioane de instrucțiuni pe secundă, indiferent de cât timp durează executarea acestor instrucțiuni (MIPS este prescurtarea de la Milioane de instrucțiuni pe secundă, milioane de instrucțiuni pe secundă ) Acest principiu sugerează că paralelismul ar trebui să joace un rol major în îmbunătățirea performanței, deoarece este posibil să se execute un număr mare de instrucțiuni doar într-o perioadă scurtă de timp dacă este posibil să executați mai multe comenzi în același timp Capitolul Organizarea sistemelor informatice Deși instrucțiunile oricărui program sunt întotdeauna localizate în memorie într-o anumită ordine, computerul este capabil să schimbe ordinea în care sunt pornite (deoarece resursele de memorie necesare pot fi ocupate) și/sau finalizate Desigur, dacă instrucțiunea setează o valoare într-un registru și instrucțiunea folosește acel registru, trebuie avută o grijă deosebită ca instrucțiunea să nu citească valoarea din registru înainte de a fi acolo Pentru a evita astfel de erori, este necesar să stocați o cantitate mare de informații suplimentare în memorie, dar datorită capacității de a executa mai multe comenzi în același timp, performanța este încă mai mare + Comenzile ar trebui să fie ușor de decodat Limita numărului de comenzi care pot fi executate pe secundă depinde de rata de decodare a comenzilor individuale Decodificarea comenzilor vă permite să determinați ce resurse au nevoie și ce acțiuni trebuie efectuate Orice face acest proces mai ușor este util De exemplu, pot fi utilizate comenzi uniforme cu o lungime fixă și un număr mic de câmpuri Cu cât sunt mai puține formate de comandă diferite, cu atât mai bine + Memoria ar trebui să fie accesată numai prin comenzi de încărcare și stocare Una dintre cele mai ușoare modalități de a împărți o operație în pași separați este să luați operanzii majorității instrucțiunilor din registre și să returnați și acolo Operația de mutare a operanzilor din memorie în registre și invers poate fi efectuată în diferite instrucțiuni Deoarece accesul la memorie durează mult și întârzierea este imprevizibilă, aceste instrucțiuni pot fi preluate de alte instrucțiuni al căror singur scop este mutarea operanzilor între registre și memorie Adică, numai comenzile de încărcare și stocare (LOAD și STORE) ar trebui să acceseze memoria + Ar trebui să existe o mulțime de registre Deoarece accesul la memorie este destul de lent, computerul trebuie să aibă multe registre (cel puțin ) Dacă un cuvânt este apelat o dată din memorie, având în vedere un număr mare de registre, acesta poate fi păstrat într-un registru până când este nevoie Revenirea unui cuvânt dintr-un registru în memorie și reîncărcarea aceluiași cuvânt într-un registru sunt nedorite Cel mai bun mod de a evita mișcările inutile este să aveți suficiente registre Paralelism la nivel de instruire Designerii de computere se străduiesc să îmbunătățească performanța mașinilor lor O modalitate de a face procesoarele să funcționeze mai repede este creșterea vitezei de ceas, dar există unele limitări tehnologice asociate cu o anumită perioadă istorică Prin urmare, majoritatea dezvoltatorilor folosesc paralelismul (efectuarea a două sau mai multe operațiuni în același timp) pentru a îmbunătăți performanța la o anumită viteză a procesorului Există două forme principale de paralelism: paralelism la nivel de instrucțiune și paralelism la nivel de procesor În primul caz, paralelism Procesoare implementat prin rularea unui număr mare de comenzi în fiecare secundă În al doilea caz, mai multe procesoare lucrează simultan la o singură sarcină Fiecare abordare are propriile sale avantaje În această secțiune, ne vom uita la paralelismul la nivel de instrucțiune, iar în secțiunea următoare, ne vom uita la paralelismul la nivel de procesor Transportoare Se știe de mulți ani că principalul obstacol în calea vitezei mari de execuție a instrucțiunilor este nevoia de a le reaminti din memorie Pentru a rezolva această problemă, puteți apela instrucțiuni din memorie în avans și le puteți stoca într-un set special de registre Această idee a fost folosită încă din în dezvoltarea computerului IBM Stretch, iar setul de registre a fost numit buffer prefetch Astfel, când era necesară o anumită comandă, aceasta a fost apelată direct din buffer, iar accesul la memorie nu a avut loc De fapt, cu preîncărcarea, comanda este procesată în doi pași: mai întâi, comanda este invocată și apoi este executată Ideea unei conducte a avansat și mai mult această strategie Când utilizați o conductă, comanda este procesată nu în doi, ci în mai mulți pași, fiecare dintre acestea fiind implementat de o componentă hardware specifică și toate aceste componente pot funcționa în paralel Pe fig , și arată un transportor de cinci blocuri, care se numesc trepte Prima etapă (blocul C ) apelează comanda din memorie și o plasează într-un buffer unde este stocată până când este nevoie A doua etapă (blocul C ) decodifică această instrucțiune, determinând tipul acesteia și tipul operanzilor ei A treia etapă (blocul C ) localizează operanzii și îi apelează din registre sau din memorie С С СЗ С С Orez Transportor în cinci trepte (a); starea fiecărei etape în funcție de numărul de cicluri parcurse (b) cicluri afișate Capitolul Organizarea sistemelor informatice A patra etapă (blocul C ) execută instrucțiunea, de obicei prin trecerea operanzilor prin calea datelor (vezi Figura ) În cele din urmă, blocul C scrie rezultatul înapoi în registrul corect Pe fig , b vedem cum funcționează conducta în timp În timpul ciclului , blocul C procesează instrucțiunea prin rechemarea acesteia din memorie În timpul ciclului , blocul C decodifică instrucțiunea , în timp ce blocul C apelează din memorie instrucțiunea În timpul ciclului , blocul C apelează operanzii pentru instrucțiunea , blocul C decodifică instrucțiunea și blocul C apelează instrucțiunea În timpul ciclului , blocul C execută instrucțiunea , C apelează operanzii pentru instrucțiunea , C decodifică instrucțiunea și C apelează instrucțiunea În cele din urmă, în timpul ciclului , blocul C scrie rezultatul instrucțiunii înapoi în registru, în timp ce celelalte etape ale conductei procesați următoarele instrucțiuni Pentru a înțelege mai bine cum funcționează o conductă, luați în considerare un exemplu similar Imaginați-vă o fabrică de bomboane în care prăjiturile sunt coapte și ambalate pentru expediere separat Să presupunem că în departamentul de expediere există un transportor lung, de-a lungul căruia sunt lucrători (sau etape de procesare) La fiecare secunde (acesta este timpul ciclului), primul lucrător plasează o cutie de prăjituri goală pe banda transportoare Această cutie este trimisă celui de-al doilea muncitor, care pune tortul în ea Cutia de tort este apoi livrată unui al treilea lucrător care o închide și sigilează Apoi se duce la al patrulea muncitor, care îi pune o ștampilă În cele din urmă, un al cincilea muncitor scoate cutia de pe banda transportoare și o pune într-un container mare pentru a fi expediată la supermarket Conducta computerului funcționează aproape în același mod: fiecare comandă (în cazul unei fabrici de bomboane, a unui tort) trece prin mai multe etape de procesare înainte de execuția finală Revenind la conducta noastră din Fig Să presupunem că timpul de ciclu pentru această mașină este de ns Apoi este nevoie de ns pentru ca o instrucțiune să treacă prin întreaga conductă La prima vedere, poate părea că un astfel de computer va executa de milioane de instrucțiuni pe secundă, dar în realitate viteza lui este mult mai mare În timpul fiecărui ciclu ( ns), o nouă instrucțiune este finalizată, astfel încât mașina execută nu , ci de milioane de instrucțiuni pe secundă! Conductele permit un compromis între latență (timpul necesar pentru a executa o singură instrucțiune) și debitul procesorului (numărul de instrucțiuni pe care un procesor le execută pe secundă) Dacă timpul dus-întors este T ns și conducta are n etape, latența va fi nT ns Deoarece o comandă este executată într-un apel și / T sunt tastate într-o secundă din astfel de apeluri, numărul de comenzi pe secundă este, de asemenea, IO / T Să presupunem că dacă T = ns, atunci de milioane de comenzi sunt executate în fiecare secundă Împărțiți rata de instrucțiuni la milion pentru a obține valoarea MIPS; astfel, ( /G)/ = /T MIPS În principiu, viteza de execuție a instrucțiunilor poate fi măsurată și în miliarde de operații pe secundă (BIPS Instructions Per Second, BIPS), dar nimeni nu face acest lucru și noi nu o vom face Procesoare Arhitecturi suprascalare Un transportor este bun, dar două sunt și mai bune Una dintre schemele posibile ale unui procesor cu două conducte este prezentată în Fig Se bazează pe transportorul prezentat în Fig Aici, unitatea generală de preluare a instrucțiunilor apelează simultan două instrucțiuni din memorie și plasează fiecare dintre ele într-una dintre conducte Fiecare conductă conține o ALU pentru operațiuni paralele Pentru a fi executate în paralel, două instrucțiuni nu trebuie să intre în conflict asupra resurselor (cum ar fi registrele) și nici una nu trebuie să depindă de rezultatul executării celeilalte Ca și în cazul unei singure conducte, fie compilatorul trebuie să garanteze absența unor situații anormale (când, de exemplu, hardware-ul nu verifică comenzile pentru incompatibilitate și produce un rezultat incorect la procesarea unor astfel de comenzi), fie din cauza hardware-ului suplimentar, conflictele trebuie detectate și eliminate direct în timpul executării comenzilor С С СЗ С С Orez Conductă dublă în cinci trepte cu o unitate comună de preluare a instrucțiunilor La început, conductele (atât duale, cât și convenționale) au fost utilizate numai în calculatoarele RISC Procesorul și predecesorii săi nu le-au avut Conductele în procesoarele Intel au apărut abia începând cu modelul Procesorul avea o conductă în cinci etape, iar Pentium avea două astfel de conducte O schemă similară este prezentată în Fig , dar împărțirea funcțiilor între a doua și a treia etapă (au fost numite decodor și decodor ) a fost ușor diferită Conducta principală (u-pipeline) ar putea executa comenzi arbitrare A doua conductă (v-pipeline) ar putea executa doar instrucțiuni întregi simple, precum și o instrucțiune simplă în virgulă mobilă (FXCH) Există reguli complexe pentru a determina dacă o pereche de instrucțiuni este compatibilă în ceea ce privește capacitatea de a se executa în paralel Dacă comenzile dintr-o pereche erau complexe sau incompatibile, doar una dintre ele a fost executată (în u-pipeline) A doua echipă rămasă a fost apoi asociată cu următoarea echipă Comenzile au fost întotdeauna executate în ordine Astfel, procesorul Pentium conținea compilatoare speciale care combinau instrucțiuni compatibile în perechi și puteau produce programe care rulau mai repede decât în versiunile anterioare Măsurătorile au arătat că programele în care Trebuie menționat că funcționarea paralelă a unităților de procesor individuale a avut loc în microprocesorul anterior ( ) Acest mecanism a devenit prototipul conductei în etape a microprocesorului - Notă științific ed Capitolul Organizarea sistemelor informatice se folosesc operații cu numere întregi, la aceeași viteză de ceas, Pentium-ul este aproape de două ori mai rapid decât [ ] Fără îndoială, avantajul de viteză a fost obținut datorită celei de-a doua conducte Tranziția la patru conducte este posibilă, dar necesită hardware greoi (rețineți că informaticienii, spre deosebire de folclorişti, nu cred în numărul norocos trei) În schimb, se folosește o abordare diferită Ideea principală este o conductă cu multe blocuri funcționale, așa cum se arată în Fig Pentium II, de exemplu, are o structură similară (o vom analiza în detaliu în Capitolul ) În , termenul de arhitectură superscalar a fost introdus pentru a desemna această abordare [ ] Cu toate acestea, o idee similară a fost întruchipată cu treizeci de ani mai devreme în computerul CDC Acest computer a numit instrucțiunea din memorie la fiecare ns și a plasat-o într-unul din cele blocuri funcționale pentru execuție paralelă În timp ce comenzile erau executate, CPU a apelat următoarea comandă C Orez Procesor superscalar cu cinci blocuri funcționale De-a lungul timpului, sensul termenului "superscalar" s-a schimbat oarecum Superscalar se referă acum la procesoare care pot rula mai multe instrucțiuni (de multe ori patru până la șase) într-un singur ciclu de ceas Desigur, pentru a transmite toate aceste comenzi, un procesor superscalar trebuie să aibă mai multe blocuri funcționale Deoarece în procesoarele de acest tip, de regulă, este prevăzută o conductă, structura sa corespunde de obicei cu Fig În lumina unei astfel de dinamici terminologice, astăzi se poate susține că computerul nu era superscalar din punct de vedere tehnic - la urma urmei, nu a fost rulată mai mult de o instrucțiune într-un singur ciclu de ceas Cu toate acestea, un rezultat similar a fost obținut în acest caz - comenzile au fost lansate mai repede decât au fost executate De fapt, diferența de performanță între Procesoare Un procesor cu un ciclu de ns care trimite o instrucțiune la patru blocuri funcționale în acea perioadă și un procesor cu un ciclu de ns care rulează patru instrucțiuni în acel timp este subtil Ambele procesoare aderă la principiul că viteza de pornire depășește viteza de control; în acest caz, sarcina de lucru este distribuită între mai multe blocuri funcționale Rețineți că la ieșirea etapei , comenzile apar mult mai repede decât este capabilă etapa să le proceseze Dacă la ieșirea etapei instrucțiunile au apărut la fiecare ns și toate blocurile funcționale și-au făcut treaba în ns, atunci doar un singur bloc ar funcționa întotdeauna la etapa , ceea ce ar face însăși ideea unei conducte fără sens De fapt, majoritatea blocurilor funcționale din etapa (mai precis, atât blocurile de acces la memorie, cât și blocul în virgulă mobilă) durează mult mai mult de un ciclu pentru a procesa o instrucțiune După cum se poate observa din fig , pot exista mai multe ALU-uri în etapa Paralelismul procesorului Cererea de calculatoare care rulează la viteze din ce în ce mai mari continuă neabătută Astronomii vor să afle ce s-a întâmplat în prima microsecundă după Big Bang, economiștii vor să modeleze întreaga economie mondială, adolescenții vor să joace jocuri interactive D cu prietenii lor virtuali pe Internet Procesoarele devin din ce în ce mai rapide, dar au în permanență probleme de transfer de date, deoarece viteza de propagare a undelor electromagnetice în firele de cupru și a luminii în cablurile de fibră optică rămâne în continuare la cm/ns, indiferent cât de inteligenți sunt inginerii Intel În plus, cu cât procesorul rulează mai repede, cu atât se încălzește mai mult , astfel încât apare sarcina de a-l proteja de supraîncălzire Paralelismul la nivel de instrucțiuni ajută într-o anumită măsură, dar conductele și arhitectura superscalară îmbunătățesc de obicei performanța doar cu un factor de - Pentru a crește productivitatea de , sau de mai multe ori, trebuie să creați computere cu mai multe procesoare Să facem cunoștință cu dispozitivul unor astfel de computere Calculatoare Matrix Multe probleme din științele fizice și tehnice implică utilizarea de tablouri sau alte structuri ordonate Adesea, aceleași calcule pot fi efectuate pe diferite seturi de date în același timp Ordinea și structura programelor concepute pentru a efectua acest tip de calcule sunt foarte convenabile în ceea ce privește accelerarea calculelor datorită procesării paralele a comenzilor Există două scheme pentru implementarea accelerată a programelor științifice mari Deși ambele scheme sunt în multe privințe Acest lucru nu este complet corect Există multe exemple care contrazic această afirmație Disiparea căldurii, desigur, depinde de frecvența de comutare a elementelor, dar depinde și de dimensiunea acestor elemente și de tensiunea la care funcționează - Notă științific ed Capitolul Organizarea sistemelor informatice sunt similare, unul dintre ele implică extinderea unui singur procesor, celălalt - adăugarea unui computer paralel Un procesor matrice (procesor argau) este format dintr-un număr mare de procesoare similare care execută aceeași secvență de instrucțiuni pentru diferite seturi de date Primul astfel de procesor din lume a fost ILLIAC IV (Universitatea din Illinois) Este prezentat schematic în Fig [ ] Ideea inițială a fost de a construi o mașină formată din patru cadrane, fiecare dintre ele conținând o matrice x de blocuri procesor/memorie A existat un bloc de control pentru fiecare cadran A trimis comenzi care au fost executate de toate procesoarele simultan, în timp ce fiecare procesor își folosea propriile date din propria memorie (datele au fost încărcate în timpul inițializării) Această soluție, care diferă semnificativ de mașina standard von Neumann, este uneori denumită arhitectura SIMD (Single Instruction-stream Multiple Data-stream) Datorită costului foarte mare, a fost construit doar un astfel de cadran, dar ar putea efectua de milioane de operații în virgulă mobilă pe secundă Dacă mașina ar fi construită folosind patru cadrane, ar putea efectua miliard de operații în virgulă mobilă pe secundă, iar puterea de calcul a unei astfel de mașini ar fi de două ori mai mare decât a computerelor din întreaga lume Bloc de control Transmite comenzi Orez Procesor matrice ILLIAC IV O matrice x de blocuri de procesor/memorie Din punctul de vedere al unui programator, un procesor vectorial este foarte asemănător cu un procesor matrice La fel ca matricea, este extrem de eficient atunci când se efectuează o secvență de operații pe perechi de elemente de date Cu toate acestea, spre deosebire de un procesor cu matrice, toate operațiunile de adunare sunt efectuate într-un singur bloc de însumare, care are o structură pipelined Cray Research, fondată de Seymour Cray, a lansat multe modele de procesoare vectoriale, începând cu modelul Cry- ( ) Cray Research face parte acum din SGI Procesoare Ambele tipuri de procesoare funcționează cu matrice de date Ambele execută aceleași instrucțiuni, care, de exemplu, adună în perechi elementele a doi vectori Totuși, dacă procesorul matriceal are atât de mulți sumatori câte elemente sunt în matrice, procesorul vectorial conține un registru vectorial format dintr-un set de registre condiționale Aceste registre sunt încărcate din memorie cu o singură instrucțiune care de fapt o face secvenţial Instrucțiunea de adăugare adaugă elementele a doi astfel de vectori în perechi, încărcându-le din două registre vectoriale într-un sumator cu o structură pipeline Ca urmare, din sumator iese un alt vector, care fie este plasat în registrul vectorial, fie imediat folosit ca operand la efectuarea unei alte operații cu vectori Procesoarele Matrix sunt în prezent scoase din producție, dar principiul pe care se bazează este încă relevant O idee similară este folosită în seturile de instrucțiuni MMX și SSE ale procesoarelor Pentium și rezolvă cu succes problema execuției accelerate a programelor multimedia În acest sens, computerul ILLIAC IV poate fi considerat unul dintre progenitorii procesorului Pentium Multiprocesoare Elementele procesorului matriceal sunt interconectate, deoarece activitatea lor este controlată de o singură unitate de control Un sistem de mai multe procesoare paralele care partajează o memorie comună se numește multiprocesor Deoarece fiecare procesor poate scrie informații în orice parte a memoriei și poate citi informații din orice parte a memoriei, pentru a evita orice inconsecvență, funcționarea lor trebuie să fie coordonată de software Într-o situație în care două sau mai multe procesoare au capacitatea de a interacționa strâns, iar acesta este cazul multiprocesoarelor, aceste procesoare sunt numite strâns cuplate (strâns cuplate) Există diferite moduri de a implementa această idee Cel mai simplu dintre ele este conectarea mai multor procesoare și memorie partajată cu o singură magistrală Schema unui astfel de multiprocesor este prezentată în fig , a Multe companii produc sisteme similare Este ușor de înțeles că dacă aveți un număr mare de procesoare rapide care încearcă în mod constant să acceseze memoria prin aceeași magistrală, vor apărea conflicte Au fost dezvoltate diverse scheme pentru a rezolva această problemă și pentru a îmbunătăți performanța computerului Una dintre ele este prezentată în Fig b Într-un astfel de computer, fiecare procesor are propria sa memorie locală care este inaccesibilă altor procesoare Această memorie este utilizată pentru acele programe și date care nu trebuie să fie partajate între mai multe procesoare La accesarea memoriei locale, magistrala principală nu este utilizată și astfel cantitatea de informații transferate prin aceasta devine mai mică Sunt posibile și alte soluții la problemă (de exemplu, memoria cache) Multiprocesoarele au un avantaj față de alte tipuri de computere paralele, deoarece este foarte ușor să lucrezi cu o singură memorie partajată De exemplu, să ne imaginăm că programul caută celule canceroase pe terminat Capitolul Organizarea sistemelor informatice imagine microscopică a țesutului Fotografia digitală poate fi stocată într-o memorie partajată, fiecare procesor examinând o zonă specifică a fotografiei Deoarece fiecare procesor are acces la o memorie partajată, examinarea unei celule situate în mai multe zone simultan nu este dificilă Anvelopa Anvelopa a b Orez Multiprocesor cu o singură magistrală și memorie partajată (a); multiprocesor cu propria memorie locală pentru fiecare procesor (b) Multicalculatoare Multiprocesoarele cu un număr mic de procesoare ( , adică toate accesările se fac numai la memoria cache, atunci timpul de acces tinde spre s Pe de altă parte, dacă h -> , adică de fiecare dată când trebuie să accesați memoria principală, atunci timpul de acces tinde spre c + m: mai întâi, este necesar timpul c pentru a verifica memoria cache (în acest caz, fără succes), apoi timpul t pentru a accesa memoria principală Pe unele sisteme, accesul la memoria principală poate începe în paralel cu sonda cache, astfel încât, în cazul unei pierderi de memorie cache, ciclul de acces la memoria principală a început deja Cu toate acestea, această strategie necesită abilitatea de a opri procesul de accesare a memoriei principale în cazul unei lovituri în cache, ceea ce complică dezvoltarea unui astfel de computer Memoria principală și memoria cache sunt împărțite în blocuri de dimensiuni fixe pe baza principiului localității Blocurile dintr-un cache sunt denumite în mod obișnuit linii cache Pe o pierdere de memorie cache din memoria principală în cache Capitolul Organizarea sistemelor informatice se încarcă întreaga linie, nu doar cuvântul necesar De exemplu, dacă un șir este format din de octeți, accesarea adresei presupune încărcarea întregului șir (octeți de la la ) în memoria cache în cazul în care sunt necesare alte cuvinte din acest șir după un timp Această modalitate de accesare a memoriei este mai eficientă decât apelarea fiecărui cuvânt individual, deoarece apelarea a k cuvinte o dată este mult mai rapidă decât a apela un cuvânt de k ori Memoria cache este foarte importantă pentru procesoarele de înaltă performanță Totuși, aici apar o serie de întrebări Prima întrebare este cantitatea de memorie cache Cu cât volumul este mai mare, cu atât memoria funcționează mai bine, dar cu atât este mai scumpă A doua problemă este dimensiunea liniei cache-ului Un cache de KB poate fi împărțit în de linii de octeți, de linii de octeți și așa mai departe Vom discuta despre dispozitivul cache în detaliu în Capitolul A patra întrebare este dacă instrucțiunile și datele ar trebui păstrate împreună într-un cache partajat Cea mai ușoară modalitate este de a dezvolta un cache unificat, care va stoca atât datele, cât și comenzile În acest caz, apelurile de comandă și de date sunt echilibrate automat Cu toate acestea, tendința actuală este de a folosi un cache divizat, în care instrucțiunile sunt stocate într-un cache și datele în altul Această arhitectură este numită și arhitectura Harvard, deoarece ideea de a folosi memorie separată pentru instrucțiuni și memorie separată pentru date a fost pentru prima dată încorporată în computerul Marc III, care a fost creat de Howard Aiken la Harvard Dezvoltatorii moderni au luat această cale, deoarece arhitecturile pipeline sunt acum larg răspândite și, cu o organizare pipeline, ar trebui să fie posibilă accesarea simultană atât a comenzilor, cât și a datelor (operanzi) Un cache partajat permite accesul simultan, dar un cache partajat nu De asemenea, deoarece instrucțiunile nu se schimbă în mod normal în timpul execuției programului, conținutul cache-ului de instrucțiuni nu trebuie să fie scris înapoi în memoria principală În cele din urmă, a cincea întrebare este numărul de blocuri cache În zilele noastre, foarte des, cache-ul de primul nivel se află direct pe cipul procesorului, cache-ul de al doilea nivel nu se află pe cipul în sine, ci în pachetul procesorului, iar cache-ul de al treilea nivel este și mai departe de procesor Asamblarea modulelor de memorie și tipurile acestora De la apariția memoriei cu semiconductor până la începutul anilor , toate cipurile de memorie au fost fabricate, vândute și instalate ca cipuri individuale Aceste microcircuite au conținut de la Kbit la Mbit de informații și multe altele Primele computere personale lăsau adesea sloturi goale, astfel încât cumpărătorul să poată introduce cipuri de memorie suplimentare dacă este necesar În prezent este utilizată o abordare diferită Un grup de cipuri (de obicei sau ) este montat pe o placă de circuit imprimat minuscul și vândut ca o singură unitate Se numește SIMM (Single Inline Memory Module - modul de memorie Memoria auxiliară DIMM (modul dublu de memorie în linie) sau DIMM (modul dublu de memorie în linie) Plăcile SIMM au un conector de margine cu de pini; rata de date pe ciclu de ceas este de de biți DIMM-urile vin de obicei cu doi conectori de margine (câte unul pe fiecare parte a plăcii) cu de pini; astfel, numărul total de contacte ajunge la , iar rata de date crește la de biți pe ciclu Schema modulului SIMM este prezentată în fig Orez Modul SIMM de MB Modulul este controlat de două microcircuite De obicei, SIMM-urile și DIMM-urile conțin cipuri de Mbit ( MB) fiecare Astfel, întregul modul deține MB de informații Multe computere oferă posibilitatea de a instala patru module; prin urmare, atunci când utilizați module de MB, cantitatea totală de memorie ajunge la GB Notebook-urile folosesc de obicei un DIMM mai mic numit SO-DIMM (Small Outline DIMM) SIMM-urile și DIMM-urile pot conține un bit de paritate sau un cod de corectare a erorilor, totuși, deoarece probabilitatea erorilor într-un modul este de aproximativ o eroare în ani, majoritatea computerelor convenționale nu folosesc scheme de detectare și corectare a erorilor Memoria auxiliară Indiferent de cantitatea de memorie principală, aceasta va fi încă mică Este natura noastră, vrem mereu să stocăm mai multe date în memoria computerului decât poate conține Odată cu dezvoltarea tehnologiei, oamenii vin în minte astfel de lucruri care anterior erau considerate complet fantastice De exemplu, s-ar putea imagina că Biblioteca Congresului a decis să digitalizeze și să vândă textul integral, cu toate ilustrațiile, al tuturor titlurilor pe care le deținea ("Toată cunoștințele umane pentru doar USD") În medie, fiecare carte conține MB de text și MB de ilustrații ambalate Astfel, pentru a găzdui de milioane de cărți, ai nevoie de IO octeți sau TB de memorie Pentru a stoca toate lungmetrajele existente ( ) aveți nevoie de aproximativ aceeași cantitate de spațiu Un astfel de volum de informații nu poate fi plasat în prezent în memoria principală și este puțin probabil să se facă în viitor (cel puțin în următoarele câteva decenii) Capitolul Organizarea sistemelor informatice Structura ierarhică a memoriei Structura ierarhică a memoriei este soluția tradițională la problema stocării unor cantități mari de date (Fig ) În vârful ierarhiei se află registrele procesorului Accesul la registre este cel mai rapid Urmează memoria cache, care acum variază de la KB la câțiva megaocteți Apoi vine memoria principală, care în prezent poate stoca de la MB la zeci de gigaocteți Apoi vin discurile magnetice și, în final, unitățile de bandă și discurile optice, care sunt folosite pentru a stoca arhive Orez Organizarea memoriei pe cinci niveluri Pe măsură ce vă deplasați de sus în jos în ierarhie, trei parametri se modifică În primul rând, timpul de acces crește Accesul la înregistrare durează câteva nanosecunde, accesul la cache puțin mai mult, accesul la memoria principală câteva zeci de nanosecunde Apoi, există un decalaj mare: accesul la disc durează cel puțin µs, iar timpul de acces pentru benzi magnetice și discuri optice poate fi măsurat în general în secunde (din moment ce aceste medii de stocare trebuie încă plasate în dispozitivul corespunzător) În al doilea rând, cantitatea de memorie crește Registrele pot conține cel mult de octeți, memorie cache - câțiva megaocteți, memoria principală - zeci de mii de megaocteți, discuri magnetice - de la câteva unități la câteva zeci de gigaocteți Benzile magnetice și discurile optice sunt stocate independent de computer, astfel încât volumul lor total este limitat doar de capacitățile financiare ale proprietarului În al treilea rând, numărul de biți pe care îi primiți pentru dolar crește Costul memoriei principale este de câțiva dolari pe megaoctet , Rețineți că costul unitar al memoriei este în scădere constantă, în timp ce volumul acesteia crește Legea lui Moore se aplică și aici Astăzi, un megabyte de memorie RAM costă aproximativ cenți - Notă științific ed Memoria auxiliară discurile magnetice câțiva cenți pe megaoctet, iar banda magnetică câțiva dolari pe gigaoctet sau mai puțin Registrele, memoria cache și memoria principală au fost deja acoperite În secțiunile următoare, vom vorbi despre discuri magnetice și apoi vom trece la studiul discurilor optice Nu vom lua în considerare unitățile de bandă, deoarece acestea sunt rar folosite; în plus, nu este practic nimic de spus despre ele Discuri magnetice Un disc magnetic este format din una sau mai multe suprafețe de aluminiu acoperite cu un strat magnetic Inițial, diametrul lor era de cm, acum - de la la cm, pentru laptopuri - mai puțin de cm, iar această valoare continuă să scadă Capul discului, care conține bobina de inducție, se deplasează pe suprafața discului, sprijinindu-se pe o pernă de aer Rețineți că capul unei dischete atinge suprafața Când un curent pozitiv sau negativ trece prin cap, acesta magnetizează suprafața de sub cap În acest caz, particulele magnetice sunt magnetizate la dreapta sau la stânga, în funcție de polaritatea curentului Când capul trece peste zona magnetizată, în ea apare un curent pozitiv sau negativ (în cap), ceea ce face posibilă citirea biților scrisi anterior Deoarece discul se rotește sub cap, fluxul de biți poate fi scris și apoi citit din Configurația pistei de disc este prezentată în fig Intervalul intersectorial Lățimea pistei - microni până la , microni Orez Fragment de pistă de disc (două sectoare) În prezent, IBM le face din sticlă - Notă științific ed Capitolul Organizarea sistemelor informatice O piesă este o secvență circulară de biți scrisă pe un disc într-o singură rotație Fiecare pistă este împărțită în sectoare de lungime fixă Fiecare sector conține de obicei octeți de date Înainte de date este un preambul (preambul), care permite capului să se sincronizeze înainte de a citi sau scrie După date vine codul de corectare a erorilor (Error-Correcting Code, ECC), care este folosit ca cod Hamming sau mai des codul Reed-Solomon, care vă permite să corectați mai multe erori, și nu doar pe unele singure Există un interval intersectorial între sectoarele adiacente Mulți producători listează dimensiunea unui disc neformatat (ca și cum fiecare piesă ar conține doar date), deși ar fi mai corect să enumerați capacitatea unui disc formatat care nu include preambule, coduri ECC și intervale intersectoriale Capacitatea unei unități formatate este de obicei cu % mai mică decât cea a unei unități neformatate Toate discurile au suporturi, se pot deplasa înainte și înapoi de-a lungul razei la distanțe diferite de axul în jurul căruia se rotește discul Diferite trasee sunt înregistrate la distanțe diferite de axă Astfel, pistele sunt o serie de cercuri concentrice dispuse în jurul fusului Lățimea pistei depinde de mărimea capului și de precizia mișcării acestuia Astăzi discurile au între și de piste pe cm, adică lățimea fiecărei piste este între și microni ( micron = = / mm) Trebuie remarcat faptul că pista nu este o depresiune pe suprafața discului, ci pur și simplu un inel de material magnetizat, care este separat de alte piste prin zone mici de graniță Densitatea de biți a pistelor concentrice diferă în funcție de distanța de la centrul discului și depinde în principal de calitatea suprafeței discului și de curățenia aerului Densitatea de înregistrare a discurilor moderne variază de la la bps Astfel, atunci când scrieți în direcția radială, există de aproximativ de ori mai multe date pe unitate de suprafață decât în direcția circumferențială Pentru a crește densitatea, producătorii dezvoltă tehnologii în care măsurarea "lungă" a biților nu se desfășoară de-a lungul circumferinței discului, ci pe verticală - pare să intre în adâncimea materialului Aceste tehnologii sunt denumite colectiv înregistrare perpendiculară, iar primele modele de discuri comerciale bazate pe aceste tehnologii vor apărea foarte curând Pentru a obține o suprafață de înaltă calitate și o puritate suficientă a aerului, discurile sunt sigilate ermetic Astfel de discuri se numesc hard disk Au fost lansate pentru prima dată de IBM Aveau MB de memorie fixă și MB de memorie amovibilă Poate că aceste discuri au fost asociate cu puștile Winchester - Majoritatea discurilor magnetice constau din mai multe platouri stivuite unul sub celălalt, așa cum se arată în Fig Fiecare suprafață este furnizată cu un suport și un cap Suporturile sunt fixate în așa fel încât să se poată deplasa simultan la distanțe diferite față de axă Un set de piste situate la aceeași distanță de centru se numește cilindru În modern pușcă cu două țevi de calibru - Notă transl Memoria auxiliară Modelele interschimbabile de drive PC sunt instalate de la până la platouri care conțin de la până la de suprafețe de lucru Suprafața Suprafața Suprafața Suprafața Suprafața Suprafața Suprafața Suprafata O Orez Winchester cu patru unități Performanța discului depinde de mulți factori Pentru a citi sau scrie un sector, capul trebuie să se deplaseze la distanța dorită față de axă Acest proces se numește căutare Timpul mediu de căutare între melodiile luate la întâmplare este de până la ms, iar căutarea între melodiile adiacente este mai mică de ms Când capul este plasat la distanța dorită de centru, acesta așteaptă ceva timp (numit timp de așteptare sector) până când sectorul dorit este sub cap Majoritatea discurilor se rotesc la , sau rpm Astfel, timpul mediu de așteptare al unui sector (jumătate de rotație) este între și ms Timpul de transfer al informațiilor depinde de densitatea de înregistrare și de viteza de rotație La rate de transfer de până la MB pe secundă , timpul de transfer per sector ( octeți) este de până la µs Prin urmare, timpul de căutare și latența sectorului determină timpul de transmitere a informațiilor Este clar că citirea sectoarelor din diferite părți ale discului este ineficientă De menționat că, din cauza prezenței preambulelor, codurilor ECC, a decalajelor dintre sectoare, precum și datorită faptului că se petrece un anumit timp căutând o pistă și așteptând un sector, există o diferență uriașă între rata de date pentru cazurile în care datele necesare sunt împrăștiate în diferite părți ale discului și când sunt în același loc și citite secvenţial Rata maximă de date în primul caz este atinsă în momentul în care capul este situat deasupra primului bit de date Cu toate acestea, această viteză de operare poate fi menținută doar într-un singur sector Pentru unele aplicații, cum ar fi multimedia, contează rata medie de biți într-o anumită perioadă, ținând cont de timpul necesar de căutare și de latența sectorului În hard disk-urile moderne, viteza de citire liniară a depășit deja MB pe secundă - Notă științific ed Capitolul Organizarea sistemelor informatice Cu puțină ingeniozitate, formula veche a școlii pentru calcularea circumferinței c = pg va dezvălui că lungimea totală a pistelor exterioare este mai mare decât lungimea celor interioare Deoarece toate discurile magnetice se rotesc cu o viteză unghiulară constantă, indiferent unde se află capetele, există o problemă evidentă În trecut, atunci când fabricau discuri, producătorii creau cea mai mare densitate de înregistrare posibilă pe pista interioară și, pe măsură ce vă îndepărtați de centrul discului, densitatea de înregistrare a scăzut treptat Dacă o pistă conține, de exemplu, sectoare, atunci fiecare dintre ele ocupă un arc de ° și nu contează pe ce cilindru se află această pistă În prezent este utilizată o strategie diferită Cilindrii sunt împărțiți în zone (de obicei de la la pe un disc) Pe măsură ce vă îndepărtați de centrul discului, numărul de sectoare pe pistă din fiecare zonă crește Acest lucru complică procedura de stocare a informațiilor pe pistă, dar crește capacitatea discului, care este considerată mai importantă Toate sectoarele au aceeași dimensiune Diagrama unui disc cu cinci zone este prezentată în Fig Un așa-numit controler este conectat la disc - un microcircuit care controlează discul Unele controlere conțin un procesor întreg Sarcinile controlerului includ recepția de comenzi precum READ, WRITE și FORMAT din software (adică scrierea tuturor preambulelor), controlul mișcării brațului, detectarea și corectarea erorilor, conversia octeților citiți din memorie într-un flux continuu de biți și viciu invers Unele controlere memorează în memoria cache mai multe sectoare pentru utilizare ulterioară și omit sectoare defecte Necesitatea acestei din urmă funcție este cauzată de prezența sectoarelor cu avarie, Memoria auxiliară adică o zonă magnetizată permanent Când controlerul detectează un sector defect, îl înlocuiește cu unul dintre sectoarele libere care sunt alocate special în acest scop în fiecare cilindru sau zonă dischete Odată cu inventarea computerului personal, a devenit necesară distribuirea software-ului într-un fel Soluția problemei a fost o dischetă, sau o dischetă, un mic mediu de stocare amovibil Dischetele au fost inventate de IBM Inițial, dischetele conțineau informații despre întreținerea mainframe-urilor (pentru angajații companiei cumpărătoare) Dar producătorii de computere au adoptat curând ideea și au început să folosească dischetele ca mediu convenabil pentru înregistrarea software-ului și vânzarea acestuia Dischetele au aceleași caracteristici generale ca și discurile pe care tocmai le-am uitat, cu singura diferență că capetele hard disk-urilor se deplasează pe suprafața discului pe o pernă de aer, în timp ce pentru dischete capetele ating suprafața Drept urmare, atât dischetele în sine, cât și capetele se uzează foarte repede Prin urmare, atunci când nu există citire și scriere a informațiilor, capetele sunt îndepărtate de la suprafață, iar computerul oprește rotația discului Acest lucru prelungește durata de viață a dischetelor Dar, în același timp, dacă se primește o comandă de citire sau scriere, există o mică întârziere (aproximativ o jumătate de secundă) înainte ca motorul să înceapă să funcționeze Dischetele au rămas în uz timp de aproximativ de ani, dar majoritatea configurațiilor moderne ale computerelor nu includ unități de dischete Unități IDE Unitățile computerelor personale moderne au evoluat de la unitatea IBM PC XT Era o unitate Seagate de MB controlată de un controler Xebec pe un card integrat Acest disc avea capete, cilindri și sectoare pe pistă Controlerul ar putea gestiona două discuri Sistemul de operare citește și scrie informații pe disc Pentru a face acest lucru, ea a transmis parametri registrelor procesorului și a numit BIOS (Basic Input Output System - sistem de bază de intrare / ieșire) situat în ROM-ul încorporat Sistemul BIOS a solicitat instrucțiuni ale mașinii pentru a încărca registrele controlerului, ceea ce a început transferul de date La început, controlerul a fost plasat pe o placă separată, iar odată cu lansarea dispozitivelor IDE (Integrated Drive Electronics - un dispozitiv cu controler integrat) la mijlocul anilor , a început să fie încorporat în placa de bază Cu toate acestea, convențiile de apelare BIOS nu s-au schimbat deoarece era necesar să se asigure compatibilitatea cu versiunile mai vechi Apel la sectoare A început să fie încorporat în hard disk-ul propriu-zis, adică în placa de circuit imprimat situată în carcasa hard diskului Placa de bază găzduiește a doua parte a controlerului pentru această interfață - Notă științific ed Capitolul Organizarea sistemelor informatice a fost produs prin numere de cap, cilindru și sector, cu capete și cilindri numerotate de la , iar sectoarele de la Probabil, această situație a apărut din cauza unei erori a unuia dintre programatorii BIOS care și-a scris capodopera în asamblatorul Având biți pentru Numărul capetelor, biți pentru un sector și biți pentru un cilindru, discul ar putea conține maximum capete, de sectoare și de cilindri, adică un total de de sectoare Capacitatea unui astfel de disc era de MB, iar la acel moment această cifră era considerată uriașă (ai acumula acum reproșuri pe o mașină nouă care nu poate gestiona discuri mai mari de PB?) În curând au apărut discuri cu o capacitate de peste MB, dar aveau o geometrie diferită ( capete, de sectoare, de cilindri) Sistemul de operare nu le-a putut accesa deoarece convențiile de apelare BIOS nu s-au schimbat (cerință de compatibilitate) Ca urmare, controlerele au început să emită informații pe baza ipotezei că geometria discului se potrivește cu cea specificată în BIOS Dar, de fapt, geometria virtuală a fost pur și simplu suprapusă pe cea reală Deși această metodă a funcționat, a îngreunat sistemele de operare să dispună datele pe disc într-un anumit mod pentru a reduce timpul de căutare În cele din urmă, unitățile IDE au fost înlocuite cu dispozitive EIDE (Extended IDE - dispozitive avansate cu controler integrat), suportând o schemă de adresare suplimentară LBA (Logical Block Addressing - adresare bloc liniară) Cu adresare liniară, sectoarele sunt pur și simplu numerotate de la la - Deși controlerul trebuie să traducă adresele LBA în adrese de cap, sector și cilindru, dimensiunea discului poate depăși MB Din păcate, însă, s-a născut o nouă limitare de x de octeți ( GB) În , când a fost adoptat standardul EIDE, nimănui nu i-a trecut prin cap că discuri cu această capacitate vor apărea ceva timp mai târziu În general, comitetele de standardizare, precum politicienii, preferă adesea să amâne rezolvarea problemelor, lăsându-le în seama succesorilor lor Unitățile și controlerele EIDE au și alte îmbunătățiri De exemplu, sunt capabili să controleze discuri (datorită a două canale, fiecare dintre acestea putând fi conectat la un disc primar și secundar), au o rată de transfer de date mai mare ( , în loc de MB / s), pot controla Unități CD-ROM și DVD Standardul EIDE s-a îmbunătățit odată cu dezvoltarea progresului tehnologic, dar cu toate acestea succesorul său a fost numit ATA- (AT Attachment), care arăta ca un indiciu la sistemele IBM PC / AT (abrevierea AT, formată din sintagma Advanced Technology - "progresiv tehnologie", în acest context, referit la procesorul progresiv pe biți tactat la MHz) Următoarea versiune a standardului, numită ATAP- (ATA Packet Interface - ATA packet interface), a fost caracterizată printr-o viteză de Mbit/s În versiunea ATARI- , a ajuns la Mbps Pe măsură ce limita de GB impusă de adresele liniare pe de biți a devenit din ce în ce mai dureroasă, standardul ATARI- a crescut dimensiunea adresei LBA la de biți Limita acestui standard este x ( PB) Dacă capacitatea discului crește cu % anual, LBA-urile pe de biți vor crește Memoria auxiliară Datele vor rămâne relevante până în aproximativ Pentru a afla cum va fi rezolvată această problemă, probabil că puteți citi edițiile din a -a a acestei cărți Evident, următorul pas este creșterea dimensiunii adresei LBA la de biți În standardul ATARI- , rata de transfer de date a fost crescută la Mbps În plus, pentru prima dată s-a acordat atenție problemei zgomotului Adevărata descoperire a fost făcută în standardul ATAI- În loc să extindă conectorul discului (și, în consecință, rata de transfer de date), a apărut o specificație pentru interfața serial ATA (Serial ATA, SATA), care a făcut posibilă transferul de informații printr-un conector cu pini la viteze de la Mbps (în timp, viteza va crește la , Gbps /Cu) Prin înlocuirea cablului plat cu de fire cu un cablu rotund de câțiva milimetri în diametru, ventilația unității de sistem s-a îmbunătățit În plus, la trimiterea semnalelor prin interfața SATA se consumă doar , V (comparativ cu V al ATARI- ), rezultând un consum total de energie mai mic Cel mai probabil, în câțiva ani, toate computerele vor fi transferate la standardul SATA Acest scenariu este susținut de faptul că problema consumului de energie devine din ce în ce mai urgentă - atât pentru centrele de date echipate cu ferme de discuri puternice, cât și pentru laptopurile cu surse de alimentare limitate [ ] Unități SCSI Unitățile SCSI sunt la fel ca unitățile IDE în ceea ce privește cilindrii, pistele și sectoarele, dar au o interfață diferită și o rată de transfer de date mai mare În , compania inventatorului dischetei, Howard Shugart, a lansat un disc cu interfața SASI (Shugart Associates System Interface) În , institutul ANCI, după lungi discuții, a transformat oarecum această interfață și și-a schimbat numele în SCSI (Small Computer System Interface - small computer system interface) Abrevierea SCSI se pronunță "tell" Versiunile cu viteză mai mare se numesc Fast SCSI ( MHz), Ultra SCSI ( MHz), Ultra SCSI ( MHz), Ultra SCSI ( MHz) și Ultra SCSI ( MHz) Fiecare dintre aceste arome avea și o versiune pe biți Principalii parametri ai tuturor acestor versiuni sunt rezumați în tabel Deoarece unitățile SCSI au o rată de transfer mare, acestea sunt utilizate în majoritatea stațiilor de lucru UNIX produse de Sun, HP, SGI și alții Aceste unități sunt, de asemenea, încorporate în computerele Macintosh și serverele de rețea Intel SCSI nu este doar o interfață pentru hard disk Acesta este un bus la care se pot conecta un controler SCSI și până la șapte dispozitive suplimentare Acestea pot fi una sau mai multe hard disk-uri SCSI, cititoare și scriitoare CD-ROM, scanere, unități de bandă și alte periferice Fiecare dispozitiv are propriul cod de identificare de la la (până la pentru versiunile pe biți) Fiecare dispozitiv are doi conectori: unul este de intrare, celălalt este de ieșire Cablurile conectează mufa de ieșire a unui dispozitiv la mufa de intrare a următorului dispozitiv și așa mai departe Capitolul Organizarea sistemelor informatice la fel pentru conectarea becurilor într-o ghirlandă de pom de Crăciun Ultimul dispozitiv din lanț trebuie să fie un terminal, astfel încât reflexiile de la capetele magistralei să nu distorsioneze datele de pe magistrală De obicei, controlerul este plasat pe cardul încorporat și este prima verigă din lanț, deși acest lucru nu este necesar Tabelul Câteva opțiuni SCSI valide Nume Cantitate Frecvență magistrală, MHz Rată de transmisie, biți MB/s SCSI- Rapid SCSI Wide Fast SCSI Ultra SCSI Wide Ultra SCSI Ultra SCSI Wide Ultra SCSI Ultra SCSI Wide Ultra SCSI Ultra SCSI Wide Ultra SCSI Cel mai obișnuit cablu pentru un dispozitiv SCSI pe biți are de fire, dintre care (împământare) sunt asociate cu alte , oferind o bună imunitate la zgomot, care este necesară pentru funcționarea de mare viteză Din cele de fire, sunt folosite pentru date, pentru paritate, pentru control, iar restul sunt salvate pentru utilizare ulterioară Dispozitivele pe și de biți necesită cablu suplimentar pentru semnale suplimentare Lungimea cablului poate fi de câțiva metri pentru a asigura comunicarea cu dispozitivele externe (scanere etc ) Controlerele SCSI și perifericele SCSI pot fi surse de comandă sau receptori De obicei, controlerul, acționând ca o sursă, trimite comenzi către discuri și alte periferice, care la rândul lor acționează ca niște chiuvete Comenzile sunt blocuri de până la octeți care îi spun receptorului ce trebuie să facă Comenzile și răspunsurile sunt scrise ca fraze, folosind diferite semnale de control pentru a delimita fraze și pentru a rezolva conflictele care apar atunci când mai multe dispozitive încearcă să folosească magistrala în același timp Acest lucru este foarte important deoarece interfața SCSI permite tuturor dispozitivelor să funcționeze simultan, ceea ce îmbunătățește foarte mult performanța mediului, deoarece mai multe procese sunt activate simultan (UNIX sau Windows XP sunt exemple) În sistemele IDE și EIDE, dacă unul dintre dispozitive este în modul activ, restul trebuie să fie pasiv Memoria auxiliară Matrice RAID Performanța procesorului a crescut semnificativ în ultimul deceniu, aproape dublându-se la fiecare , ani Cu toate acestea, performanța discurilor este diferită În anii , timpul mediu de căutare în minicalculatoare era între și ms Acum timpul de căutare este de aproximativ ms În multe industrii tehnice (de exemplu, în industria auto sau a aviației), o creștere de sau ori a productivității în două decenii ar fi considerată uriașă, dar în industria computerelor, aceste cifre sunt uluitoare Astfel, decalajul dintre performanța procesoarelor și a discurilor a continuat să crească în tot acest timp După cum am văzut deja, pentru a crește viteza procesorului, se folosesc tehnologii paralele de procesare a datelor De mulți ani încoace, diverși oameni au venit cu ideea că ar fi bine să facem ca dispozitivele I/O să funcționeze și în paralel În , un articol [ ] propunea opțiuni diferite pentru organizarea memoriei pe disc, care puteau fi folosite pentru a îmbunătăți performanța, fiabilitatea sau ambele Aceste idei au fost imediat adoptate de producătorii de computere, ceea ce a dus la apariția unei noi clase de dispozitive I/O numite RAID Inițial, acronimul RAID a reprezentat Redundant Array of Inexpensive Disks (matrice redundantă de discuri ieftine), dar mai târziu litera I din abreviere în loc de originalul Ieftin (neexpensive) a început să însemne Independent (independent) Poate că le-a dat producătorilor dreptul legal de a face discurile nerezonabil de scumpe? Matricea RAID a fost opusă discului SLED (Single Large Expensive Disk - one large expensive disk) Ideea de bază din spatele RAID este următoarea Lângă computer este instalată o cutie cu discuri (de obicei un server mare), controlerul de disc este înlocuit cu un controler RAID, datele sunt copiate în matricea RAID și apoi sunt efectuate acțiunile obișnuite Cu alte cuvinte, sistemul de operare percepe RAID ca SLED, în timp ce matricea RAID are performanțe și fiabilitate mai ridicate Deoarece unitățile SCSI oferă performanțe ridicate la un cost relativ scăzut și, deoarece un singur controler poate gestiona mai multe unități (până la șapte unități pe modelele SCSI pe biți și până la pe modele pe biți), majoritatea dispozitivelor RAID constau dintr-un sistem SCSI controller , conceput pentru a gestiona o matrice RAID și o cutie de discuri SCSI, pe care sistemul de operare le percepe ca un singur disc mare Astfel, nu sunt necesare modificări software pentru a utiliza o matrice RAID, ceea ce este foarte benefic pentru mulți administratori de sistem Sistemele RAID au mai multe avantaje În primul rând, după cum sa menționat deja, software-ul tratează matricea RAID ca pe o unitate mare În al doilea rând, datele de pe toate discurile dintr-o matrice RAID sunt împărțite pe discuri în așa fel încât să poată fi efectuate operațiuni paralele Câteva opțiuni diferite de distribuție a datelor propuse în [ ] sunt acum cunoscute ca RAID , RAID și așa mai departe până la RAID În plus, există câteva alte niveluri care Capitolul Organizarea sistemelor informatice despre care nu vom discuta Termenul "nivel" este oarecum regretabil, deoarece aici nu există o structură ierarhică Doar că există opțiuni diferite pentru organizarea discurilor O matrice RAID de nivel este prezentată în Figura , a Este un disc virtual împărțit în benzi (fâșii) de k sectoare fiecare, în timp ce sectoarele de la la k - ocupă banda , sectoarele de la k la k - ocupă banda etc Pentru k = , fiecare o bandă este un sector, pentru k = fiecare bandă este două sectoare și așa mai departe , a Aceasta se numește striping de date pe discuri Figura prezintă o matrice RAID cu patru unități De exemplu, dacă software-ul apelează o comandă pentru a citi un bloc de date care constă din patru benzi consecutive și începe la granița dintre benzi, atunci controlerul RAID împarte această comandă în comenzi separate, fiecare pentru una dintre cele patru unități, și le execută în paralel Astfel, obținem un dispozitiv I/O paralel fără a schimba software-ul Nivelul RAID funcționează cel mai bine cu cereri mari - cu cât cererea este mai mare, cu atât mai bine Dacă o interogare trebuie să utilizeze mai multe benzi decât unitățile din matricea RAID, atunci unele unități primesc solicitări multiple și, de îndată ce o astfel de unitate completează prima solicitare, trece la următoarea Sarcina controlerului este de a împărți corect cererea, de a trimite comenzile corecte pe discurile corespunzătoare în secvența corectă și apoi de a scrie corect rezultatele în memorie Performanța acestei abordări este foarte mare și nu este dificil de implementat RAID funcționează cel mai rău cu sistemele de operare care solicită periodic bucăți mici de date (un sector per acces) În acest caz, rezultatele vor fi bineînțeles corecte, dar nu va exista paralelism și, prin urmare, nici un câștig de performanță Un alt dezavantaj al acestei structuri este că este potențial mai puțin fiabilă decât SLED-ul De exemplu, luați în considerare o matrice RAID de patru unități, fiecare dintre ele poate eșua în medie la fiecare de ore Adică, eșecurile într-o astfel de matrice RAID vor avea loc aproximativ la fiecare de ore, în timp ce toate datele se pot pierde O unitate SLED se defectează, în medie, la fiecare de ore, dar, deoarece este o singură unitate, este de ori mai fiabilă Deoarece nu există redundanță în designul descris, aceasta este o matrice RAID "falsă" Următoarea variantă este matricea RAID de nivel Este prezentată în fig b și, spre deosebire de RAID , este un adevărat RAID În această structură, toate discurile sunt duplicate, deci există discuri originale și copii de rezervă De fapt real, dar nivel zero - Notă științific ed În fig b arată nivelul RAID + , nu nivelul - Notă științific ed Memoria auxiliară d e Dunga O Dunga Dunga Dunga CHO-Z Dunga Dunga Dunga Dunga ch - ; RAID nivelul Dunga Banda Grup Grup unsprezece - Dunga Dunga Dunga Dunga 'CHO-Z Dunga Dunga Dunga , - Dunga Dunga Banda - Grup Grup unsprezece RAID nivelul Grup - Grup Grup Grup - Grup Grup Grup Grup Orez Matrice RAID de la nivelul la Backup-urile și unitățile de paritate sunt incolore Capitolul Organizarea sistemelor informatice La înregistrarea informațiilor, fiecare bandă este înregistrată de două ori Oricare dintre cele două copii poate fi folosită pentru citire, iar informațiile pot fi încărcate de pe mai multe discuri în același timp decât într-o matrice RAID Prin urmare, performanța de scriere va fi aceeași ca un disc obișnuit, iar performanța de citire va fi mult mai mare (maximum de două ori) Toleranța la erori este excelentă: dacă un disc eșuează, se folosește o copie Recuperarea constă pur și simplu în instalarea unei noi unități și copierea tuturor informațiilor din backup pe aceasta Spre deosebire de nivelurile și , care operează pe benzi de sectoare, nivelul RAID operează pe cuvinte și uneori chiar pe octeți Imaginați-vă că fiecare octet al discului virtual este împărțit în două fragmente de biți, apoi la fiecare dintre ele se adaugă un cod Hamming și astfel se obține un cuvânt de biți, în care , și sunt biți de paritate Apoi imaginați-vă că cele discuri prezentate în Fig , c, sincronizate de poziția consolei și poziția de rotație Apoi, într-o singură operație, puteți scrie un cuvânt de biți cu un cod Hamming pe discuri, câte un bit pe disc O schemă similară a fost folosită în așa-numitele mașini de gândire SM- biți de paritate (cod Hamming) au fost adăugați la cuvântul de date de de biți Rezultatul a fost un cuvânt de cod de de biți, căruia i s-a adăugat un bit suplimentar de paritate, iar acest cuvânt a fost înregistrat pe de discuri Performanța generală a fost uriașă, deoarece de sectoare de date au putut fi scrise în același timp Dacă se pierdea unul dintre discuri, nici nu existau probleme, deoarece pierderea unui disc însemna pierderea a câte un bit în fiecare cuvânt de de biți, iar codul Hamming a rezolvat acest lucru instantaneu Cu toate acestea, o astfel de schemă necesită ca toate discurile să fie sincronizate prin rotație De asemenea, are sens să-l folosești doar dacă ai un număr suficient de mare de discuri (chiar și cu de discuri de date și discuri de paritate, suprasarcina este de %) În plus, controlerul are o sarcină mare, deoarece acesta trebuie să calculeze suma de control a codului Hamming atunci când transmite fiecare bit O matrice RAID de nivel este o versiune simplificată a unei matrice RAID de nivel , d Aici, pentru fiecare cuvânt de date, bit de paritate este calculat și scris pe discul de paritate Ca și în cazul unei matrice RAID de nivel , discurile trebuie să fie perfect sincronizate, deoarece fiecare cuvânt de date este răspândit pe mai multe discuri La prima vedere, poate părea că un singur bit de paritate vă permite doar să detectați, dar nu să corectați erorile Când vine vorba de erori arbitrare, această observație este adevărată Cu toate acestea, în cazul unei defecțiuni a discului, bitul de paritate oferă o corecție a erorii pe un bit, deoarece poziția bitului greșit este cunoscută Dacă apare o eroare, controlerul raportează că toți biții sunt Dacă apare o eroare de paritate într-un cuvânt, bitul de pe disc care a eșuat trebuie să fie și, prin urmare, este corectat Deși nivelurile RAID și oferă rate de transfer de date foarte mari, numărul de solicitări I/O pe secundă nu este mai mare decât cu o singură unitate Memoria auxiliară Nivelurile RAID și , la fel ca RAID-urile entry-level, funcționează cu dungi mai degrabă decât cu cuvinte de paritate și nu necesită sincronizare pe disc O matrice RAID de nivel (vezi Figura e) este organizată în același mod ca o matrice de nivel RAID , cu diferența că o matrice de nivel RAID are un disc suplimentar pe care sunt scrise benzi de paritate De exemplu, fiecare bandă este formată din k octeți Toate benzile trebuie să fie într-o relație XOR, iar banda de paritate pentru această relație trebuie să fie, de asemenea, k octeți Dacă apare o defecțiune a discului, octeții pierduți pot fi recalculați folosind informații de pe discul de paritate Această soluție previne pierderile de disc, dar reduce semnificativ performanța în cazul patch-urilor mici Dacă un sector se modifică, este necesar să citiți informațiile de pe toate discurile pentru a calcula din nou biții de paritate și a-i scrie din nou În schimb, puteți citi datele vechi și vechii biți de paritate de pe disc și puteți calcula noi biți de paritate din aceștia Dar chiar și cu această optimizare a procesului, dacă există remedieri minore, sunt necesare două citiri și două scrieri Astfel de dificultăți în încărcarea datelor pe un disc de paritate pot fi un obstacol în atingerea performanțelor înalte Această problemă este eliminată la nivelul RAID , în care biții de paritate sunt distribuiți uniform pe toate discurile și scriși într-un cerc, așa cum se arată în Figura , f Cu toate acestea, în cazul unei defecțiuni a discului, este destul de dificil să restabiliți conținutul discului pierdut, deși este posibil CD-ROM-uri Discurile optice, care au fost folosite inițial pentru înregistrarea programelor de televiziune, au devenit ulterior unul dintre principalele medii de stocare din industria calculatoarelor Datorită capacității lor ridicate și prețului scăzut, discurile optice sunt utilizate pe scară largă pentru distribuția de software, cărți, filme și alte tipuri de date și pentru copiile de arhivare ale hard discurilor Primele discuri optice au fost inventate de corporația olandeză Philips pentru a stoca filme Aveau un diametru de cm, produse sub marca LaserVision, dar nu erau populare nicăieri, cu excepția Japoniei În , Philips Corporation, împreună cu Sony, au dezvoltat discuri compacte (Compact Disc, CD), care au înlocuit rapid discurile de vinil folosite pentru înregistrarea muzicii Descrierea detaliilor tehnice ale CD-ului a fost publicată în Standardul internațional oficial (IS ), adesea denumită Cartea roșie (din culoarea coperții) Standardele internaționale sunt publicate de Organizația Internațională de Standardizare (ISO), care este un analog cu organizațiile naționale de standardizare precum ANSI, DIN etc Fiecare astfel de organizație are propriul său număr IS (Standard Internațional - standard internațional) Standardul Internațional pentru Specificațiile Discurilor a fost publicat pentru a face compatibile CD-urile de la diferiți editori de muzică și playere de la diferiți producători Toate CD-urile trebuie să aibă mm în diametru și , mm grosime, iar diametrul găurii Capitolul Organizarea sistemelor informatice în mijloc ar trebui să fie de mm CD-urile audio au fost primul mediu de stocare digital care a intrat pe piața de masă Se presupune că vor fi folosite timp de o sută de ani CD-ul este realizat folosind un laser infraroșu foarte puternic care arde găuri de , microni într-un disc special de sticlă Pe acest disc principal, se face un șablon cu proeminențe în acele locuri în care laserul a ars găuri În șablon se injectează rășină lichidă (policarbonat) și astfel se obține un CD cu același set de găuri ca într-un disc de sticlă Pe rășină se aplică un strat foarte subțire de aluminiu, care, la rândul său, este acoperită cu un lac de protecție După aceea, se aplică o etichetă Degajările din stratul inferior de rășină se numesc gropi, iar spațiile plate dintre găuri se numesc terenuri În timpul redării, o diodă laser de putere mică strălucește lumină infraroșie la o lungime de undă de , microni pe puțuri și platforme succesive Laserul este situat pe partea de rășină a discului, astfel încât găurile laser se transformă în proeminențe pe o suprafață plană Deoarece gropițele sunt un sfert din lungimea de undă a luminii laser, lungimea luminii reflectate de proeminență este jumătate din lungimea de undă a luminii reflectate de pe suprafața plană din jurul proeminenței Ca rezultat, dacă lumina este reflectată de pe proeminență, fotodetectorul jucătorului primește mai puțină lumină decât atunci când este reflectată de pe pad Acesta este modul în care placa turnantă distinge gaura de teren Deși ar părea mai simplu să folosești o gaură pentru a înregistra un zero și un pad pentru a înregistra unul, s-a dovedit a fi mai fiabil să folosești o tranziție hole-to-pad sau pad-to-hole pentru unul și nicio tranziție la un zero Puțurile și locurile sunt înregistrate în spirală Înregistrarea începe la o anumită distanță de orificiul din centrul discului și progresează spre margine, ocupând mm de disc Spirala trece prin de rotații în jurul discului (aproximativ pe mm) Dacă spirala este îndreptată, lungimea ei va fi de , km Spirala este prezentată în fig Pentru ca muzica să sune normal, găurile și terenurile trebuie să se schimbe cu o viteză liniară constantă Prin urmare, viteza de rotație a CD-ului ar trebui să scadă treptat pe măsură ce capul de citire se deplasează de la centrul discului la marginea exterioară Cu capul pe interiorul platoului, pentru a atinge viteza dorita de cm/s, viteza de rotatie trebuie sa fie de rpm Când capul se află în exteriorul platoului, viteza de rotație scade la rpm, permițând aceeași viteză liniară În acest fel, un disc compact care se rotește cu o viteză liniară constantă diferă de un disc magnetic care se rotește cu o viteză unghiulară constantă, indiferent unde se află capul în acel moment În plus, viteza de rotație a unui CD ( rpm) nu corespunde deloc cu viteza de rotație a discurilor magnetice, care variază de la la rpm În , Philips și Sony au început să folosească CD-uri pentru a stoca datele computerului Ei au publicat Cartea galbenă, care a definit standardul exact pentru ceea ce au numit CD-ROM (Compact Disc-Read Only) Memoria auxiliară Meshogu - memorie doar pentru citire pe un CD) Pentru a intra pe piața CD-urilor audio dezvoltată atunci, CD-urile de computer trebuiau să aibă aceeași dimensiune ca și CD-urile audio, compatibile mecanic și optic cu acestea și produse folosind aceeași tehnologie Ca urmare a acestei decizii, au fost necesare motoare care funcționau la viteză mică și puteau schimba viteza Costul producerii unui CD a fost în medie de aproximativ USD Cartea galbenă definește formatele de date computerizate De asemenea, descrie tehnici avansate de corectare a erorilor, care este un pas semnificativ, deoarece informaticienii, spre deosebire de iubitorii de muzică, acordă o mare importanță erorilor de biți Aspectul unui CD constă în codificarea fiecărui octet cu un caracter de biți După cum sa menționat deja, biți sunt suficienți pentru a codifica un octet de biți cu un cod Hamming, lăsând doi biți în plus De fapt, se folosește un sistem de codare mai puternic Traducerea de la un sistem pe la biți pentru citirea informațiilor se face în hardware folosind tabele de căutare La nivelul următor, de caractere consecutive formează un cadru de de biți Fiecare cadru conține de biți de date ( de octeți) Restul de de biți sunt utilizați pentru corectarea și controlul erorilor Pentru CD-urile audio și pentru computer, acest sistem este același Pentru CD-urile de computer, fiecare de cadre sunt grupate într-un sector, așa cum se arată în Fig Fiecare sector începe cu un preambul de octeți, primii dintre care formează valoarea OOFFFFFFFFFFFFFFFFFFOO (hexazecimal), care permite jucătorului să determine începutul sectorului Următorii octeți conțin numărul sectorului Numărul este necesar deoarece căutarea unui CD, care are date în spirală, este mult mai dificilă decât un disc magnetic, care are date în piste concentrice Pentru a găsi un anumit sector, software-ul calculează Capitolul Organizarea sistemelor informatice află unde aproximativ trebuie să mergi; un cap de citire este plasat acolo și apoi începe o căutare a preambulului pentru a stabili cât de corectă a fost numărarea Ultimul octet al preambulului determină tipul discului Caractere de biți fiecare de caractere alcătuiesc cadru Cadre de de biți, fiecare cu de octeți Preambul de cadre alcătuiesc sector de date date ECC Tip sector ( octeți) Octetul Orez Aspect CD Cartea galbenă definește două tipuri de discuri Pe fig Figura prezintă structura datelor pentru tipul , unde preambulul este de octeți, datele sunt de de octeți și codul de corectare a erorilor este de de octeți (codul Reed-Solomon) Pe discurile de tip , datele și codurile de corectare a erorilor sunt combinate într-un câmp de date de de octeți Această schemă este utilizată pentru aplicațiile care nu trebuie să repare erori (sau, mai precis, care nu își pot lua timp pentru a face acest lucru), cum ar fi audio și video Rețineți că sunt utilizate trei scheme de corectare a erorilor pentru a asigura un grad ridicat de fiabilitate: în cadrul unui simbol, într-un cadru și într-un sector Erorile pe un singur bit sunt corectate la cel mai scăzut nivel, exploziile de erori sunt corectate la nivel de cadru și toate erorile reziduale sunt corectate la nivel de sector Pentru a menține această fiabilitate, sunt necesare de cadre de de biți ( de octeți) pentru a obține de octeți de încărcare utilă Astfel, randamentul este de doar % Unitățile CD-ROM cu o singură viteză citesc de sectoare pe secundă, ceea ce oferă o rată de transfer de date de de octeți/s pentru unitățile de tip și de octeți/s pentru unitățile de tip Unitățile cu două viteze sunt de două ori mai rapide, etc la cea mai mare viteză Un CD audio standard "deține" de minute de muzică, ceea ce corespunde unei valori de de octeți sau MB, deoarece MB = de octeți ( de octeți), nu de octeți Rețineți că nici o unitate CD-ROM de x ( octeți/s) nu este comparabilă ca performanță cu o unitate de disc magnetică SCSI- de MB/s, deși multe unități CD-ROM utilizează interfața SCSI (în plus, o interfață IDE este folosit) Din aceasta rezultă clar că CD-urile sunt semnificativ inferioare ca performanță discurilor magnetice, deși capacitatea CD-urilor este mult mai mare În , Philips Corporation a publicat Cartea Verde, adăugând elemente grafice și capacitatea de a plasa date audio, video și generale într-un singur sector, ceea ce era necesar pentru CD-urile multimedia Memoria auxiliară Ultima problemă care trebuia rezolvată în dezvoltarea CD-urilor a fost compatibilitatea sistemului de fișiere Pentru a putea folosi același CD pe computere diferite, trebuia să existe un acord privind sistemul de fișiere pentru CD-uri Pentru a emite un astfel de acord, reprezentanții diferitelor companii de calculatoare s-au întâlnit la Lake Tahoe, la granița dintre California și Nevada, și au dezvoltat un sistem de fișiere pe care l-au numit High Sierra (după numele localității în care s-au întâlnit) Acest sistem a evoluat ulterior într-un standard internațional (IS ) Există trei niveluri ale acestui standard La nivelul , sunt permise nume de fișiere de până la caractere, iar numele fișierului poate fi urmat de o extensie de până la caractere (convenția de denumire a fișierelor MS-DOS) Numele de fișiere pot conține numai litere mari, cifre și caractere de subliniere Directoarele pot fi imbricate unul în altul și nu sunt permise mai mult de nivele de ierarhie Numele de director nu poate conține o extensie La primul nivel, toate fișierele trebuie să fie învecinate, ceea ce nu este deosebit de dificil în cazul unui suport pe care informațiile sunt scrise o singură dată Orice CD care respectă standardul IS de nivel poate fi citit folosind MS-DOS, computere Apple, computere UNIX și, practic, orice altele Producătorii de CD-uri consideră această caracteristică un mare plus Nivelul al IS permite nume de fișiere cu o lungime de până la de caractere, iar nivelul permite nume de fișiere necontigue Extensiile Rock Ridge (numite după orașul din Burning Saddles al lui Mel Brooks) permit nume de fișiere foarte lungi (pentru UNIX), UID-uri și GID-uri și legături simbolice, dar CD-urile care nu sunt de nivelul nu vor fi citite pe toate computerele Discuri CD-R La început, echipamentul necesar pentru realizarea discurilor master (atât audio, cât și computer) era foarte scump Dar, așa cum se întâmplă de obicei în industria computerelor, nimic nu rămâne scump prea mult timp Până la mijlocul anilor , arzătoarele de CD-uri nu mai mari decât o placă turnantă erau obișnuite și disponibile publicului în orice magazin de hardware Aceste dispozitive erau încă diferite de discurile magnetice, deoarece informațiile scrise odată pe un CD nu mai puteau fi șterse Cu toate acestea, au găsit rapid spațiu ca medii de stocare suplimentare, iar hard disk-urile au continuat să servească drept suport principal În plus, persoane fizice și companii mici au reușit să-și producă propriile CD-uri în loturi mici sau să producă mastere și să le expedieze către marile duplicatoare comerciale Aceste discuri se numesc CD-R (CD-Recordable) Baza unui disc CD-R este un semifabricat din policarbonat de mm Aceleași spații libere sunt folosite în producția de discuri CD-ROM Cu toate acestea, discurile CD-R diferă de discurile CD-ROM prin faptul că conțin o canelură Capitolul Organizarea sistemelor informatice rina , mm, concepută pentru a direcționa laserul în timpul înregistrării Pentru a menține un feedback constant, canelura este sinusoidală cu o abatere de , mm și o frecvență de exact , kHz, astfel încât viteza de rotație să poată fi determinată cu precizie și ajustată dacă este necesar Un CD-R arată ca un disc normal, doar că nu este argintiu, ci auriu, deoarece aurul este folosit pentru a face stratul reflectorizant în loc de aluminiu Spre deosebire de CD-urile convenționale, găurile și terenurile de pe discurile CD-R sunt simulate prin modificarea reflectivității suprafeței Pentru a face acest lucru, între stratul de policarbonat și stratul de aur reflectorizant este plasat un strat de colorant (Fig ) Se folosesc două tipuri de vopsea: cianina verde și ptalocianina gălbui-portocalie Chimiștii pot argumenta la infinit care dintre ele este mai bun Acești coloranți sunt similari cu cei folosiți în fotografie, motiv pentru care Kodak și Fuji sunt principalii producători de discuri CD-R Eticheta Punctul negru de pe stratul de colorant este format prin scriere cu laser Orez Secțiune transversală a discului CD-R și a laserului (nu la scară) Un CD convențional are o structură similară, dar nu are un strat de colorant, iar în loc de un strat de aur se folosește un strat de aluminiu cu găuri În stadiul inițial, stratul de colorant este transparent, ceea ce permite luminii laser să treacă și să se reflecte în stratul de aur La înregistrarea informațiilor, puterea laserului crește la - mW Când fasciculul ajunge la colorant, colorantul se încălzește și, ca urmare, legătura chimică este ruptă Această modificare a structurii moleculare creează o pată întunecată La citire (când puterea laserului este de , mW), fotodetectorul detectează diferența dintre punctele întunecate unde colorantul a fost deteriorat și zonele transparente unde colorantul a rămas intact Când redați discul, chiar și pe o unitate CD-ROM convențională sau pe un player audio, această diferență este percepută ca diferența dintre orificiile și plăcuțele unui disc CD-ROM tradițional Memoria auxiliară Niciun nou tip de CD nu era complet fără parametrii de publicare într-o carte de o anumită culoare În cazul CD-R-ului, a fost Cartea Portocalie, lansată în Acest document descrie un disc CD-R, precum și un nou format, CD-ROM XA, care permite scrierea incrementală a informațiilor pe un CD-R (câteva sectoare astăzi, câteva sectoare mâine, câteva sectoare o lună mai târziu , etc ) Un grup de sectoare consecutive înregistrate la un moment dat se numește pistă Una dintre primele utilizări ale formatului CD-R a fost CD-ul foto Kodak La utilizarea acestei tehnologii, filmul expus și un CD foto cu poze vechi sunt introduse în procesor, care restituie CD-ul, adăugând în prealabil la acesta (după pozele vechi) imaginile din filmul expus Noul lot de date rezultat în urma scanării negativelor este scris pe un CD ca o pistă separată Această metodă de înregistrare este necesară deoarece spațiile pentru discurile CD-R sunt prea scumpe și nu este rentabilă să înregistrați fiecare bandă nouă pe un disc nou Cu toate acestea, odată cu apariția acestei tehnologii de înregistrare, a apărut o nouă problemă Înainte de lansarea Cărții Orange, la începutul tuturor CD-urilor exista un singur tabel VTOC (Cuprins Volum - cuprinsul discului), din cauza căruia era imposibil să adăugați informații pe disc Soluția problemei a fost propunerea de a atribui fiecărei piese de pe disc propriul tabel VTOC Fișierele listate în tabelul VTOC pot include toate fișierele de pe piesele anterioare sau unele dintre ele După ce un disc CD-R este introdus în cititor, sistemul de operare începe să caute printre melodii cel mai recent tabel VTOC, care reflectă starea curentă a discului Dacă tabelul VTOC listează doar câteva, și nu toate, fișierele de pe piesele existente, poate părea că fișierele au fost șterse Piesele pot fi grupate în sesiuni În acest caz, vorbim despre CD-uri cu mai multe sesiuni Playerele audio standard nu pot gestiona CD-uri cu mai multe secțiuni, deoarece încearcă să caute un singur tabel VTOC la începutul discului Fiecare piesă trebuie înregistrată continuu fără oprire Prin urmare, hard disk-ul de la care provin datele trebuie să fie suficient de rapid pentru a le livra la timp Dacă fișierele de copiat sunt localizate în diferite părți ale hard diskului, un timp lung de căutare poate duce la oprirea fluxului de date care vin pe CD-R și, în consecință, poate cauza o lipsă de date în buffer Drept urmare, veți avea un coaster minunat strălucitor (dar scump) pentru pahare și sticle Software-ul CD-R oferă de obicei o opțiune specială pentru a pre-asambla toate fișierele necesare într-un singur bloc Adică, o copie de MB a CD-ului este creată înainte ca fișierele să fie transferate pe CD-R Cu toate acestea, acest proces dublează de obicei timpul de scriere, necesită MB de spațiu liber pe disc și nu protejează unitatea de recalibrare dacă se supraîncălzi Odată cu apariția discurilor CD-R, persoanele fizice și companiile au putut să copieze cu ușurință CD-uri de computer și muzică, uneori cu încălcarea drepturilor de autor Au fost concepute diverse medii Capitolul Organizarea sistemelor informatice Măsuri de combatere a pirateriei care îngreunează citirea CD-urilor folosind software nedezvoltat de producătorul CD-ului Un astfel de mod este să utilizați informații despre câți gigaocteți este dimensiunea tuturor fișierelor de pe disc Acest lucru împiedică copierea fișierelor pe hard disk folosind software-ul convențional Dimensiunile reale ale fișierelor sunt incluse în software specializat conceput pentru a citi CD-ul sau sunt ascunse undeva pe CD (adesea sub formă criptată) Într-un alt mod, în sectoarele selectate sunt introduse coduri ECC incorecte în mod deliberat Software-ul inclus cu acest CD corectează aceste erori, iar software-ul obișnuit nu poate funcționa deoarece se știe că codurile sunt greșite În plus, este posibil să se utilizeze goluri non-standard între piste și alte "defecte" fizice Discuri CD-RW Deși oamenii sunt obișnuiți să se ocupe de medii care nu pot fi reinscriptibile (cum ar fi hârtie, film sau vinil), există încă o cerere pentru CD-uri reinscriptibile În prezent, a apărut tehnologia CD-RW (CD-ReWritable - CD rewritable), care folosește medii de aceeași dimensiune ca și pentru discurile CD-R, dar în loc de colorant (cianină sau ptalocianina) în producția de CD-RW ca înregistrarea stratul folosește un aliaj de argint, indiu, antimoniu și telur Acest aliaj are două stări: cristalin și amorf, care au reflectivitate diferită Inscriptoarele de CD sunt echipate cu un laser cu trei niveluri de putere La cea mai mare putere, laserul topește aliajul, schimbându-i starea de la cristalin cu reflexie ridicată la amorf cu reflexie redusă, rezultând o gropiță La putere medie, aliajul se topește și revine la starea sa naturală cristalină, în timp ce gaura se transformă din nou într-o platformă La putere redusă, laserul determină starea materialului (oferind citirea informațiilor), nu are loc nicio schimbare de stare Discurile CD-RW nu au înlocuit discurile CD-R, deoarece suporturile CD-RW sunt mult mai scumpe decât discurile CD-R În plus, pentru aplicațiile axate pe crearea de copii de rezervă ale hard disk-urilor, faptul că informațiile nu pot fi șterse accidental de pe un CD-R reprezintă un mare plus DVD-uri Discurile compacte din principalele formate (CD și CD-ROM) au fost folosite din De atunci, tehnologia a avansat, discurile optice de mare capacitate sunt acum destul de accesibile și la mare căutare Hollywood face o tranziție fericită de la casete video analogice la videodiscuri digitale Memoria auxiliară pentru că sunt de mai bună calitate, sunt mai ieftin de produs, durează mai mult, ocupă mai puțin spațiu pe rafturile magazinelor și nu trebuie bobinate Companiile de electrocasnice sunt încântate de un nou produs de masă și multe companii de computere sunt bucuroși să adauge multimedia la software-ul lor Această dezvoltare a tehnologiei, precum și cererea pentru produsele a trei industrii extrem de bogate și puternice, au dus la nașterea DVD-urilor Inițial, abrevierea DVD înseamnă Digital Video Disk (Digital Video Disk), acum a devenit oficial Digital Versatile Disk (Digital Versatile Disk) DVD-urile sunt similare cu CD-urile în general La fel ca CD-urile convenționale, acestea au un diametru de mm, sunt fabricate din policarbonat și conțin găuri și terenuri care sunt iluminate de o diodă laser și citite de un fotodetector Cu toate acestea, există mai multe diferențe: ♦ godeuri mai mici ( , microni în loc de , microni ca un CD obișnuit); ♦ spirală mai strânsă ( , microni între piste în loc de , microni); ♦ laser roșu (cu lungimea de undă de , microni în loc de , microni) Combinate, aceste îmbunătățiri au dus la o creștere de șapte ori a capacității (până la , GB) Cititorul DVD x funcționează la , MB/s (cititorul CD-ROM funcționează la KB/s) Din păcate, trecerea la laser roșu a necesitat playere DVD cu două lasere sau sisteme optice sofisticate pentru a citi muzică și CD-uri de computer existente Deoarece nu toate playerele DVD sunt echipate cu astfel de sisteme, nu toate pot funcționa cu CD-uri vechi În plus, nu este întotdeauna posibil să citiți discuri CD-R și CD-RW Este suficient , GB? Pot fi Folosind formatul de compresie MPEG- (standard IS ), un DVD de , GB poate stoca de minute de video pe tot ecranul de înaltă rezoluție ( x ) împreună cu audio în limbi și subtitrări în alte de limbi Aproximativ % dintre filmele realizate la Hollywood durează mai puțin de de minute Cu toate acestea, unele aplicații (cum ar fi jocurile multimedia sau publicațiile de referință) pot necesita mai mult spațiu, iar Hollywoodului nu se deranjează să pună mai multe filme pe un singur disc Ca urmare, au apărut formate DVD: Discuri cu o singură față cu un singur strat ( , GB) Discuri cu o singură față cu două straturi ( , GB) Discuri cu două fețe cu un singur strat ( , GB) Discuri cu două fețe cu două straturi ( GB) De ce atâtea formate? Pe scurt, motivul principal este politica Philips și Sony au vrut să facă discuri cu o singură față cu strat dublu, în timp ce Toshiba și Time Warner au vrut să facă discuri cu două fețe cu un singur strat Philips și Sony au crezut că cumpărătorii nu ar vrea Capitolul Organizarea sistemelor informatice flip discs, iar Time Warner credea că dacă puneți două straturi pe aceeași parte a unui disc, nu ar funcționa O soluție de compromis este să satisfacă toate dorințele, iar piața însăși va determina care dintre opțiuni va supraviețui Cu tehnologia cu două straturi, un strat semi-reflectorizant este plasat pe stratul reflectorizant inferior În funcție de locul în care este focalizat laserul, acesta este reflectat fie dintr-un strat, fie dintr-un altul Pentru a asigura citirea fiabilă a informațiilor, puțurile și zonele stratului inferior sunt făcute puțin mai mari ca dimensiune, astfel încât capacitatea sa este puțin mai mică decât cea a celui superior Discurile cu două fețe sunt create prin lipirea a două discuri cu o singură față de , mm grosime fiecare Pentru a păstra toate versiunile la aceeași grosime, un disc cu o singură față de , mm grosime este lipit de un suport alb (poate că în viitor acest suport va conține de minute de reclamă, în speranța că cumpărătorii vor fi interesați de ceea ce este pe el) Structura unui disc cu două fețe cu strat dublu este prezentată în fig Disc cu o singură față de , mm grosime Disc cu o singură față de , mm grosime Strat semi-reflectorizant Suport din policarbonat Suport din policarbonat Orez DVD cu două fețe dublu strat Reflector din aluminiu Reflector din aluminiu Strat semi-reflectorizant DVD-ul a fost dezvoltat de o corporație formată din companii de electrocasnice (șapte dintre ele japoneze) în strânsă cooperare cu marile studiouri de la Hollywood (unele dintre acestea fiind deținute de companii japoneze) Nici computerele, nici industria telecomunicațiilor nu au fost implicate în dezvoltare și, ca urmare, s-a pus accentul pe utilizarea DVD-urilor pentru a închiria și vinde filme Iată câteva dintre caracteristicile DVD standard: capacitatea de a exclude scene obscene din film (astfel încât părinții să poată transforma un film precum NC într-un film pe care copiii îl pot viziona), sunet pe șase canale, opțiuni de scalare largă Această ultimă caracteristică permite player-ului DVD să decidă cum să decupeze marginile din dreapta și din stânga ale cadrului imaginii unor astfel de filme, care au un raport lățime-înălțime de : , astfel încât să poată fi redate fără a compromite calitatea pe cele moderne Ecrane TV (raport lățime-înălțime de : ) O altă caracteristică care probabil nu ar fi trecut niciodată prin cap creatorilor tehnologiei informatice este incompatibilitatea deliberată a standardelor de disc pentru Statele Unite, pentru țările europene, pentru țările din alte țări NC - filme care conțin scene de sex și violență și nu sunt destinate vizionarii în familie - Notă transl Intrare ieșire continente Hollywood a introdus acest sistem deoarece filmele noi sunt întotdeauna lansate mai întâi în Statele Unite și numai după lansarea VHS sunt trimise în Europa Acest lucru este pentru a împiedica magazinele video europene să cumpere prea devreme videoclipuri în America (ceea ce ar putea reduce vânzările de filme noi în Europa) Probabil, dacă Hollywood ar fi în fruntea industriei computerelor, în America, dischetele ar avea o dimensiune de , inci, iar în Europa - cm Discuri Blu-ray Nimic nu durează pentru totdeauna în domeniul computerelor, în special tehnologia de stocare De îndată ce a apărut standardul DVD, a găsit imediat un concurent serios Succesorul DVD-ului poate fi considerat tehnologia Blu-Ray, care folosește un laser albastru în loc de unul roșu Laserul albastru are o lungime de undă mai scurtă, ceea ce înseamnă o precizie mai mare; datorită acestei circumstanțe, vă permite să reduceți dimensiunea găurilor și a zonelor Discurile Blu-Ray cu o singură față conțin aproximativ GB de date; pe două fețe - GB Rata de transfer de date este de , Mbps, ceea ce este foarte bun pentru discurile optice, deși este încă incomparabil cu cele magnetice (reamintim, standardul ATARI- prevede transferul de date la o viteză de Mbps, iar Ultra SCSI vă permite să creșteți viteza la Mbps) Discurile Blu-ray sunt de așteptat să înlocuiască în cele din urmă atât CD-urile, cât și DVD-urile, dar acest lucru va dura cu siguranță ani de zile Intrare ieșire După cum sa menționat la începutul acestui capitol, un sistem informatic constă din trei componente principale: unitatea centrală de procesare, memoria (primară și auxiliară) și dispozitivele de intrare/ieșire (imprimante, scanere și modemuri) Până acum, ne-am uitat la CPU și memorie Acum vom vorbi despre dispozitivele I/O și despre modul în care acestea se conectează la restul sistemului Cauciucuri Majoritatea calculatoarelor personale și stațiilor de lucru au o structură fizică similară cu cea prezentată în Fig De obicei, dispozitivul este o carcasă metalică cu un circuit integrat mare în partea de jos, care se numește placa de bază (de dragul corectitudinii politice, o puteți numi placa de bază) Placa de bază conține un cip de procesor, mai multe sloturi DIMM și diverse cipuri de suport Există, de asemenea, un bus pe placa de bază (se întinde de-a lungul plăcii) și mai mulți conectori pentru conectarea dispozitivelor I/O Uneori există două magistrale: una (bus PCI), cu o rată mare de transfer de date, este destinată dispozitivelor I/O moderne, iar cealaltă (bus ISA), cu o rată scăzută de transfer de date Capitolul Organizarea sistemelor informatice transfer de date, pentru dispozitivele vechi În computerele moderne, magistrala ISA, de regulă, este absentă Orez Structura fizică a unui computer personal Structura logică a unui computer personal convențional este ilustrată în Fig Acest computer are o magistrală pentru conectarea procesorului, a memoriei și a dispozitivelor I/O; cu toate acestea, majoritatea sistemelor au două sau mai multe autobuze Monitorizați Tastatură Unitatea CD ROM Controler cu tastatură Controler CD-ROM HDD Obosi Orez Structura logică a unui computer personal convențional Fiecare dispozitiv I/O constă din două părți: una care găzduiește majoritatea componentelor electronice și se numește controler, iar cealaltă este dispozitivul I/O în sine, cum ar fi o unitate de disc Controlerul este de obicei amplasat pe placă, care este introdusă într-un slot liber Excepție fac controlerele dispozitivelor care sunt părți integrante ale computerului (de exemplu, tastaturi), care sunt uneori situate pe placa de bază Deși afișajul (monitorul) nu poate fi numit un dispozitiv suplimentar, controlerul corespunzător este uneori amplasat pe placa încorporată, astfel încât utilizatorul să poată alege plăci cu grafică după bunul plac Intrare ieșire acceleratoare fizice sau fără acestea, instalați memorie suplimentară etc Controlerul comunică cu dispozitivul însuși printr-un cablu care se conectează la conectorul de pe spatele carcasei Controlerul își gestionează dispozitivul I/O și pentru a face acest lucru reglează accesul la magistrală De exemplu, dacă un program solicită date de pe un disc, acesta trimite o comandă controlerului de disc, care apoi trimite o comandă de căutare și alte comenzi pe disc După ce a găsit pista și sectorul adecvat, discul începe să transmită date către controler sub forma unui flux de biți Sarcina controlerului este să spargă fluxul de biți în fragmente și să scrie fiecare astfel de fragment pe măsură ce biții se acumulează pentru el în memorie Un singur fragment este de obicei unul sau mai multe cuvinte Dacă controlerul citește datele din memorie sau le scrie în memorie fără participarea procesorului central, atunci se spune că se realizează acces direct la memorie (Acces direct la memorie, DMA) Când transferul de date se termină, controlerul provoacă o întrerupere, forțând CPU să suspende programul curent și să înceapă să execute o anumită rutină Această procedură se numește handler de întrerupere și este necesară pentru a verifica erorile, dacă există, luați măsurile necesare și informați sistemul de operare că procesul I/O s-a încheiat Când handler-ul de întrerupere se termină, procesorul reia programul care a fost suspendat în momentul întreruperii Bus-ul este folosit nu numai de controlerele I/O, ci și de procesor pentru transmiterea comenzilor și a datelor Dar ce se întâmplă dacă procesorul și controlerul I/O doresc să acceseze magistrala în același timp? În acest caz, un cip special numit arbitrul de autobuz decide al cui este primul rând De obicei, dispozitivele I/O sunt preferate deoarece discurile și alte dispozitive în mișcare nu pot fi întrerupte, deoarece acest lucru poate duce la pierderea datelor Când nu rulează niciun dispozitiv I/O, CPU poate prelua controlul deplin al magistralei pentru a interacționa cu memoria Cu toate acestea, dacă orice dispozitiv I/O rulează, acesta va solicita și va primi acces la magistrală de fiecare dată când are nevoie de el Acest proces care încetinește computerul se numește furt în ciclu Structura descrisă a fost utilizată cu succes în primele computere personale, deoarece toate componentele lor au funcționat aproximativ la aceeași viteză Cu toate acestea, odată ce procesoarele, memoria și dispozitivele I/O au devenit mai rapide, a apărut o problemă: magistrala nu a putut face față sarcinii În cazul sistemelor închise, cum ar fi stațiile de lucru de inginerie, soluția a fost dezvoltarea unei noi magistrale cu o rată de date mai mare pentru următorul model de mașină Deoarece nimeni nu a migrat vreodată dispozitivele I/O de la modelul vechi la cel nou, această abordare a funcționat bine Cu toate acestea, în lumea computerelor personale, majoritatea utilizatorilor, înlocuindu-și computerul cu un model nou, nu se așteaptă să renunțe simultan la vechiul și familiarul lor imprimanta, scanerul și modemul Cu exceptia Capitolul Organizarea sistemelor informatice În plus, exista o întreagă industrie care producea o gamă largă de dispozitive I/O pentru computerele IBM PC, iar producătorii acestor dispozitive nu erau deloc interesați să înceapă toată dezvoltarea lor de la zero IBM a trecut prin această cale dificilă, lansând linia PS / după linia IBM PC Calculatoarele PS/ aveau o nouă magistrală cu o rată de transfer mai mare, dar majoritatea producătorilor de clone au continuat să folosească vechea magistrală PC, numită acum magistrala Industry Standard Architecture (ISA) Majoritatea producătorilor de discuri și I/O au continuat să producă și controlere pentru modelul vechi, așa că IBM s-a trezit într-o situație foarte neplăcută, deoarece la acea vreme era singurul producător de calculatoare personale care nu erau compatibile cu linia IBM Într-un final, compania a fost nevoită să revină la producția de calculatoare bazate pe magistrala ISA Rețineți că abrevierea ISA poate fi descifrată și ca Instruction Set Architecture (arhitectura setului de instrucțiuni), când vine vorba de nivelurile ierarhiei de instrucțiuni Deși influența pieței a dus la faptul că nu s-au făcut modificări la anvelopa veche, aceasta nu a funcționat mai repede și trebuia făcut ceva Drept urmare, alte companii au început să producă calculatoare cu mai multe magistrale, dintre care una era fie vechea magistrală ISA, fie o magistrală EISA (Extended ISA - Extended Standard Industrial Architecture), precum ISA, compatibilă cu dispozitivele I/O mai vechi În ceea ce privește cealaltă magistrală, în prezent cel mai popular model este magistrala PCI (Peripheral Component Interconnect), dezvoltată de Intel, care a decis să deschidă toate informațiile tehnice legate de magistrală pentru ca producătorii terți (inclusiv concurenții companiei) să poată dezvolta dispozitive adecvate Există multe configurații diferite de magistrală PCI Cel mai tipic dintre ele este prezentat în Fig În această configurație, CPU comunică cu controlerul de memorie printr-o conexiune dedicată de mare viteză Astfel, controlerul este conectat direct la memorie, adică transferul de date între CPU și memorie nu are loc prin magistrala PCI Cu toate acestea, perifericele de mare viteză, cum ar fi unitățile SCSI, pot fi conectate direct la magistrala PCI În plus, magistrala PCI are o conexiune paralelă la magistrala ISA, astfel încât controlerele ISA și dispozitivele aferente pot fi utilizate Acest tip de mașină conține de obicei sau sloturi PCI goale și alte sau sloturi ISA goale, astfel încât clienții să poată introduce atât carduri ISA I/O vechi (pentru dispozitive cu viteză redusă) cât și carduri PCI noi (pentru dispozitive cu viteză mare ) În prezent, există multe dispozitive de intrare-ieșire diferite Vom atinge doar cele mai comune dintre ele Trebuie remarcat faptul că magistrala ISA nu mai este menționată în standardele actuale de calculator - Notă științific ed Intrare ieșire Orez Computer personal modern cu magistrale PCI si ISA Modemul și placa de sunet sunt dispozitive ISA, controlerul SCSI este un dispozitiv PCI Terminale Terminalele computerului constau din două părți: tastatura și monitorul În mainframe, aceste părți sunt combinate într-un singur dispozitiv și sunt conectate la mainframe în sine printr-un fir obișnuit sau telefonic În companiile aeriene, bănci și diverse industrii mainframe, aceste dispozitive sunt încă utilizate pe scară largă astăzi În lumea PC-urilor, tastatura și monitorul sunt dispozitive independente, dar tastatura și monitorul mainframe-ului sunt tehnologic aceleași cu dispozitivele PC corespunzătoare Tastaturi Există mai multe tipuri de tastaturi Primele PC-uri IBM aveau un comutator sub fiecare tastă care dădea un feedback tangibil și făcea clic atunci când tasta era apăsată Astăzi, cele mai ieftine tastaturi, atunci când apăsați tastele, are loc doar contactul mecanic cu placa de circuit imprimat Tastaturile mai bune au un strat de material elastic (un tip special de cauciuc) între taste și placa de circuit Sub fiecare tastă este o cupolă mică care se îndoaie atunci când o tastă este apăsată Materialul conductor din interiorul domului completează circuitul Unele tastaturi au un magnet sub fiecare tastă, care, atunci când tasta este apăsată, trece printr-o bobină și determină astfel un curent electric Se folosesc alte metode, atât mecanice, cât și electromagnetice În computerele personale, atunci când o tastă este apăsată, are loc o procedură de întrerupere și este lansat programul de gestionare a întreruperilor (acest program face parte din software-ul sistemului de operare) Managerul de întrerupere citește conținutul unui registru hardware în controler Capitolul Organizarea sistemelor informatice tastatură pentru a obține numărul tastei apăsate (de la la ) Când cheia este eliberată, are loc o a doua întrerupere De exemplu, dacă utilizatorul apasă tasta Shift, apoi apasă și eliberează tasta M și apoi eliberează tasta Shift, sistemul de operare înțelege că dorește o literă M majusculă, nu M minusculă Gestionarea Shift, Ctrl și Alt apăsările de taste în combinație cu alte taste sunt executate numai programatic (aceasta include și binecunoscuta combinație de taste Ctrl + Alt + Del, care este folosită pentru a reporni toate computerele IBM PC și clonele acestora) Monitoare CRT Monitorul este o carcasă care conține un tub catodic (CRT) și sursele sale de alimentare Tubul cu raze catodice conține un tun de electroni care aruncă un flux de electroni pe un ecran, care este acoperit cu un strat luminiscent din interiorul părții frontale a tubului, așa cum se arată în Fig , a (Monitoarele color conțin trei tunuri de electroni: unul pentru roșu, unul pentru verde și unul pentru albastru ) În scanarea orizontală, fasciculul de electroni (fascicul) trece pe ecran în aproximativ de microsecunde, formând o linie aproape orizontală pe ecran Fasciculul face apoi o retragere orizontală spre marginea stângă pentru a începe construirea următoarei linii de scanare Un dispozitiv care, linie cu linie, creează o imagine se numește scaner raster deformare verticală Scanare orizontală Scanare verticală Retur orizontal Orez Secțiunea transversală a unui tub cu raze catodice (a); diagrama de măturare a tubului catodic (b) Măturarea orizontală este controlată de o tensiune de rampă aplicată plăcilor de deviere orizontale situate în stânga și în dreapta pistolului cu electroni Măturarea verticală este controlată de o tensiune în creștere mai lentă aplicată plăcilor verticale de deviere situate deasupra și sub tunul de electroni După un anumit număr de cicluri de măturare (de la la ), tensiunea de pe plăcile de deviere verticale și orizontale scade, iar fasciculul revine în colțul din stânga sus al ecranului Restaurarea izolatiilor complete Intrare ieșire fermentarea se realizează de până la de ori pe secundă Mișcările fasciculului sunt prezentate în fig b Deși am descris funcționarea tuburilor catodice, care folosesc câmpuri electrice pentru a mătura fasciculul de pe ecran, multe modele (în special monitoare scumpe) folosesc câmpuri magnetice în loc de cele electrice Pentru a obține o imagine pe ecran din puncte, în interiorul tubului catodic este amplasată o grilă Când o tensiune pozitivă este aplicată rețelei, electronii sunt excitați, fasciculul este îndreptat către ecran, care după un timp începe să strălucească Când se folosește o tensiune negativă, electronii sunt respinși și nu trec prin rețea, iar ecranul nu luminează Astfel, tensiunea care acționează asupra rețelei face ca setul corespunzător de biți să apară pe ecran Acest mecanism permite ca semnalul electric binar să fie tradus într-un afișaj format din puncte luminoase și întunecate Monitoare LCD Tuburile cu raze catodice sunt prea voluminoase și grele pentru a fi folosite în computerele laptop, așa că este necesară o tehnologie complet diferită pentru ecranele laptopurilor Aici, afișajele cu cristale lichide sunt cel mai des folosite Tehnologia implicată este extrem de complexă, are implementări multiple și se schimbă rapid, dar vom încerca să o păstrăm cât mai scurtă și simplă Cristalele lichide sunt molecule organice vâscoase care se mișcă ca moleculele lichide, dar au o structură asemănătoare cristalului Au fost descoperite de botanistul austriac Reinitzer în și au fost folosite pentru prima dată la fabricarea diferitelor afișaje (pentru calculatoare, ceasuri etc ) în Când moleculele sunt aranjate într-o singură linie, calitățile optice ale cristalului depind de direcția și polarizarea luminii incidente Când se folosește un câmp electric, linia de molecule și, prin urmare, proprietățile optice, se modifică Dacă cristalul lichid este expus unui fascicul de lumină, intensitatea luminii emise de cristalul lichid însuși poate fi controlată de electricitate Această proprietate este utilizată la crearea afișajelor de indicator Ecranul de afișare cu cristale lichide este format din două plăci de sticlă paralele, între care se află un spațiu etanș cu un cristal lichid Electrozii transparenți sunt conectați la ambele plăci Lumina artificială sau naturală din spatele plăcii din spate luminează ecranul din interior Electrozii conectați la plăci sunt utilizați pentru a crea câmpuri electrice în cristalul lichid Diferite părți ale ecranului sunt afectate de tensiuni diferite, ceea ce vă permite să construiți o imagine Polaroidurile sunt lipite pe partea din față și din spate a ecranului, deoarece tehnologia de afișare necesită lumină polarizată Structura generală este prezentată în fig , a Monitoarele moderne cu raze catodice pot actualiza imaginea de pe ecran la o frecvență de până la sau mai multe ori pe secundă Această valoare, desigur, este invers proporțională cu numărul de linii din care este construită imaginea - Notă științific ed Capitolul Organizarea sistemelor informatice Orez Structura ecranului pe cristale lichide (a); caneluri pe plăcile din față și din spate, situate perpendicular una pe cealaltă (b) În prezent sunt utilizate diferite tipuri de afișaje cu cristale lichide, dar vom lua în considerare doar unul dintre ele - un afișaj nematic răsucit (TN) Acest afișaj are mici caneluri orizontale pe placa din spate și mici caneluri verticale pe placa frontală, așa cum se arată în Fig b În absența unui câmp electric, moleculele sunt direcționate către aceste șanțuri Deoarece ele (canelurile) sunt perpendiculare unele pe altele, moleculele de cristale lichide sunt răsucite cu ° Pe spatele ecranului este un polaroid orizontal Transmite doar lumină polarizată orizontal Pe placa frontală a afișajului este un polaroid vertical Transmite doar lumină polarizată vertical Dacă nu ar exista cristale lichide între plăci, lumina polarizată orizontal transmisă de polaroid de pe placa din spate ar fi blocată de polaroid de pe placa frontală, făcând ecranul complet negru Cu toate acestea, structura cristalină răsucită a moleculelor prin care trece lumina schimbă planul de polarizare al luminii În absența unui câmp electric, întregul ecran cu cristale lichide strălucește Dacă se aplică tensiune anumitor părți ale plăcii, structura răsucită este distrusă, blocând trecerea luminii în aceste părți Două abordări sunt utilizate în mod obișnuit pentru aplicarea tensiunii Într-un indicator de matrice pasivă ieftin, firele sunt paralele între ele pe ambii electrozi De exemplu, într-un afișaj de x , electrodul plăcii din spate conține de fire verticale, în timp ce electrodul plăcii frontale conține Intrare ieșire de fire orizontale Dacă aplicați tensiune unuia dintre firele verticale și apoi trimiteți impulsuri către unul dintre firele orizontale, puteți modifica tensiunea la o anumită poziție a pixelului și astfel întunecați punctul dorit Dacă repetați același lucru cu următorul pixel și așa mai departe, puteți obține o linie de scanare întunecată, similară liniilor din tuburile catodice De obicei, imaginea de pe ecran este redesenată de de ori pe secundă pentru a da impresia unei imagini permanente (la fel ca în tuburile cu raze catodice) A doua abordare este utilizarea unui indicator de matrice activă Costă mult mai mult decât unul pasiv, dar oferă o calitate mai bună a imaginii, ceea ce este un mare avantaj În loc de două seturi de fire perpendiculare, matricea de puncte activă are un mic comutator pe unul dintre electrozi la fiecare poziție de pixel Schimbând starea comutatoarelor, puteți crea o combinație arbitrară de tensiuni pe ecran, în funcție de combinația de biți Aceste comutatoare se numesc tranzistori cu film subțire (TFT), iar ecranele plate care le folosesc sunt numite afișaje TFT Marea majoritate a laptopurilor și monitoarelor LCD de sine stătătoare se bazează acum pe tehnologia TFT Până acum, am descris cum funcționează monitoarele monocrome Când vine vorba de monitoare color, este suficient să spunem că acestea funcționează pe aceleași principii generale ca și monitoarele monocrome, dar detaliile sunt mult mai complexe Filtrele optice sunt folosite la fiecare poziție de pixel pentru a separa albul în roșu, verde și albastru, astfel încât aceste culori pot fi afișate independent Din combinarea acestor trei culori primare se poate obține orice culoare memorie video Imaginea de pe ecranele monitoarelor CRT și TFT este actualizată de până la de ori pe secundă; pentru aceasta se folosește memoria video situată pe placa de control al afișajului Memoria video conține unul sau mai multe bitmap reprezentând imaginea afișată pe ecran Dacă, să zicem, pe ecran se potrivesc elemente de imagine x (pixeli), atunci există valori de x în memoria video, câte una pentru fiecare pixel Pentru a trece rapid de la o imagine la alta, mai multe astfel de carduri pot fi plasate în memorie În afișajele moderne, fiecare pixel este reprezentat de o valoare RGB de octeți care determină intensitatea componentelor roșu (roșu), verde (verde) și albastru (albastru) ale imaginii După cum știți, orice culoare poate fi reprezentată printr-o suprapunere liniară a celor trei culori de bază menționate Dacă memoria video stochează informații de aproximativ x pixeli, iar fiecăruia îi sunt alocați octeți, cantitatea totală a acestor date este de aproximativ , MB; prin urmare, orice manipulare a unei astfel de imagini necesită destul de mult timp CPU Din acest motiv, unele computere folosesc numere de biți pentru a defini culorile Acest număr reprezintă Capitolul Organizarea sistemelor informatice este un index al unui tabel hardware (numit paletă de culori) cu de valori RGB ( de biți) Această soluție, cunoscută sub numele de culoare indexată, reduce cantitatea de date stocate în memoria video cu / În același timp, atunci când se aplică o culoare indexată, mai mult de de culori nu pot fi afișate pe ecran în orice moment De regulă, se formează un bitmap individual pentru fiecare fereastră, ceea ce înseamnă că, dacă există o paletă hardware, doar una dintre toate ferestrele prezente pe ecran este redată corect Pentru a scoate imagini raster (adică formate pe baza de hărți de bit) imagini necesită multă lățime de bandă De exemplu, pentru a reda un cadru de date multimedia color în format full-screen pe un afișaj de x , trebuie copiați , MB în memoria video Având în vedere că un film complet este scos la de cadre pe secundă, rata totală de biți ar trebui să fie de , MB/s Chiar și versiunea originală a magistralei PCI ( , MB/s), ca să nu mai vorbim de magistralele ISA și EISA, nu poate oferi un astfel de debit Desigur, cu cât imaginea este mai mică, cu atât rata de transfer de date necesară este mai mică, dar acest lucru nu elimină problema Pentru a crește viteza de transfer de date de la CPU la memoria video, Intel a implementat suport pentru magistrala dedicată AGP (Accelerated Graphics Port) în linia de procesoare Pentium II, care permite transferul de de biți pe ceas la o frecvență de MHz, care corespunde unei viteze de MB/Cu În versiunile ulterioare de procesoare pentru magistrala AGP, sunt acceptate viteze de x, x și x - ca urmare, sistemul face față transferului de grafice "grele" fără a încărca magistrala PCI principală Șoareci Timpul trece, iar cei care îl înțeleg din ce în ce mai puțin se așează la computer Calculatoarele din seria ENIAC au fost folosite doar de cei care le-au proiectat În anii , doar programatori cu înaltă calificare lucrau cu computerele Astăzi, mulți dintre cei care lucrează cu computere nu știu (și nu vor să știe) nici cum funcționează un computer, nici cum este programat Cu mulți ani în urmă, majoritatea computerelor aveau o interfață de linie de comandă în care erau tastate diverse comenzi Deoarece mulți nespecialiști considerau astfel de interfețe neprietenoase sau chiar ostile, companiile de calculatoare au dezvoltat interfețe speciale cu capacitatea de a indica o anumită poziție pe ecran folosind un dispozitiv special (ca în Macintosh și Windows), care este cel mai adesea un mouse Un mouse este un dispozitiv într-o carcasă mică de plastic care se așează pe o masă lângă o tastatură Dacă mutați mouse-ul pe masă, indicatorul de pe ecran se va mișca și el, ceea ce face posibilă îndreptarea acestuia către unul sau altul element al ecranului Mouse-ul are unul, două sau trei butoane care permit utilizatorilor să selecteze elementele de meniu atunci când sunt apăsate Au existat multe dezbateri despre câte butoane ar trebui să aibă un mouse Pentru utilizatorii începători, un buton a fost suficient (în acest caz este imposibil să se confunde butoanele), dar Intrare ieșire omologii lor mai experimentați au preferat mai multe butoane pentru a permite acțiuni complexe să fie efectuate pe ecran Există trei tipuri de șoareci: mecanici, optici și optomecanici La șoarecii de primul tip, roțile de cauciuc sunt situate dedesubt, ale căror axe sunt perpendiculare între ele Dacă mouse-ul se mișcă într-o direcție verticală, atunci o roată se rotește, iar dacă este în direcție orizontală, atunci alta Fiecare roată acţionează un rezistor (potenţiometru) Dacă măsurați modificarea rezistenței, puteți afla cât de departe s-a întors roata și, astfel, puteți calcula cât de departe s-a deplasat mouse-ul în fiecare direcție În ultimii ani, astfel de șoareci au fost aproape complet înlocuiți de un nou model, care folosește o minge care iese ușor de jos în loc de roți (Fig ) Orez Folosind mouse-ul pentru a selecta un element de meniu Următorul tip este mouse-ul optic Nu are nici roți, nici minge În schimb, un LED și un fotodetector sunt situate în partea de jos a mouse-ului Un mouse optic se deplasează pe suprafața unui tampon special din plastic care conține o rețea dreptunghiulară cu linii care sunt apropiate unele de altele Pe măsură ce mouse-ul se deplasează pe grilă, fotodetectorul detectează intersecțiile liniilor modificând cantitatea de lumină reflectată de LED Un dispozitiv electronic din interiorul mouse-ului numără numărul de linii traversate în fiecare direcție Al treilea tip este mouse-ul optomecanic Ea, ca un mouse mecanic mai modern, are o minge care rotește două roți situate perpendicular una pe cealaltă Roțile sunt asociate cu encodere Fiecare encoder are sloturi prin care trece lumina Când mouse-ul este mișcat, roțile se rotesc și impulsurile luminoase acționează asupra detectorilor Capitolul Organizarea sistemelor informatice de fiecare dată când apare un slot între LED și detector Numărul de impulsuri primite de detector este proporțional cu distanța Deși șoarecii pot fi instalați în mai multe moduri, o schemă comună este trimiterea unei secvențe de octeți către computer de fiecare dată când mouse-ul se mișcă la o anumită distanță minimă ( , inci, de exemplu) De obicei, aceste caracteristici sunt transmise într-un flux de biți serial Primul octet conține un număr întreg care indică cât de departe s-a deplasat mouse-ul în direcția x de la ultima dată Al doilea octet conține aceleași informații pentru direcția y Al treilea octet indică starea curentă a butoanelor mouse-ului Uneori se folosesc octeți pentru fiecare coordonată Software-ul preia aceste informații pe măsură ce intră și convertește mișcările relative ale mouse-ului într-o poziție absolută Apoi afișează o săgeată pe ecran în poziția corespunzătoare poziției mouse-ului Dacă indicați o săgeată către un anumit element de ecran și faceți clic pe butonul mouse-ului, computerul își poate da seama ce element de pe ecran este selectat Imprimante Uneori, un utilizator trebuie să imprime un document creat sau o pagină obținută de pe Internet, astfel încât computerele pot fi echipate cu o imprimantă În această secțiune, vom descrie unele dintre cele mai comune tipuri de imprimante monocrome (adică alb-negru) și color Imprimante monocrome Cele mai ieftine sunt imprimantele cu matrice de puncte, în care capul de imprimare trece secvenţial pe fiecare linie de imprimare Capul conține de la la de ace excitate de un câmp electromagnetic Imprimantele matriciale ieftine au ace pentru a imprima, să zicem de caractere pe linie într-o matrice de x Drept urmare, linia este formată din linii orizontale și fiecare dintre aceste linii este formată din x = de puncte Fiecare punct se poate imprima sau nu, în funcție de cum ar trebui să fie litera Pe fig și arată litera "A" tipărită într-o matrice de x Calitatea imprimării poate fi îmbunătățită în două moduri: prin utilizarea mai multor ace sau prin implementarea suprapunerii punctelor Pe fig Figura b prezintă litera "A" imprimată cu de ace, rezultând suprapunerea punctelor Această suprapunere necesită, de obicei, mai multe treceri pe aceeași linie de imprimare, astfel încât cu cât calitatea imprimării este mai mare, cu atât imprimanta este mai lentă Majoritatea imprimantelor pot fi configurate pentru a realiza diverse combinații de calitate și viteză Imprimantele matriceale sunt ieftine (mai ales în ceea ce privește consumabilele) și foarte fiabile, dar sunt lente, zgomotoase, iar calitatea imprimării este foarte slabă Cu toate acestea, ele sunt răspândite în cel puțin trei zone În primul rând, sunt foarte populare pentru imprimarea pe coli mari (mai mult de cm) În al doilea rând, sunt foarte convenabile de utilizat atunci când se imprimă pe bucăți mici de hârtie (de exemplu, cecuri de casierie, notificări de retragere de pe carduri de credit) Intrare ieșire card, cartele de îmbarcare ale companiei aeriene) În al treilea rând, sunt potrivite pentru imprimarea mai multor coli în același timp cu hârtie carbon introdusă între ele, iar această tehnologie este cea mai ieftină Orez Litera "A" într-o matrice x (a); litera "A" imprimată cu de ace - există o suprapunere de puncte (b) Este convenabil să utilizați acasă imprimante cu jet de cerneală ieftine Într-o astfel de imprimantă, capul de imprimare mobil conține un cartuş de cerneală Se deplasează orizontal peste hârtie în timp ce cerneala este aruncată din duzele mici Volumul unei porții de cerneală este aproximativ egal cu un picolitru Pentru claritate, clarificăm că într-o picătură de apă pot încăpea aproximativ de milioane de astfel de porții Imprimantele cu jet de cerneală sunt de două tipuri: piezoelectrice (produse de Epson) și termice (produse de Canon, HP și Lexmark) În imprimantele piezoelectrice cu jet de cerneală, lângă camera de cerneală este instalat un cristal special Când se aplică tensiune acestui cristal, acesta este deformat, ca urmare, cerneala este eliberată din duză Cu cât tensiunea este mai mare, cu atât este mai mare porțiunea de cerneală de ieșire, iar acest proces este controlat de software În imprimantele cu jet de cerneală termică (bule), este instalat un mic rezistor în fiecare duză Când se aplică tensiune, rezistorul se încălzește rapid, aduce temperatura cernelii la punctul de fierbere, ca urmare, acestea din urmă se transformă în bule de gaz Deoarece volumul bulei este mai mare decât volumul de cerneală pură, se creează o presiune crescută în duză, sub influența căreia cerneala este pulverizată pe hârtie Apoi duza se răcește și, ca urmare a scăderii presiunii în interiorul duzei, o nouă porțiune de cerneală îi este furnizată din cartuș Viteza imprimantei în această schemă este limitată de intervalul de timp al ciclului de fierbere / răcire Dimensiunea tuturor picăturilor de cerneală formate este aceeași și, de regulă, este inferioară celei a imprimantelor piezoelectrice Imprimantele cu jet de cerneală au de obicei rezoluții cuprinse între dpi (puncte pe inch) și dpi Sunt destul de ieftine și silențioase, dar au viteze de imprimare mici și excepționale Capitolul Organizarea sistemelor informatice cartușe scumpe Calitatea imprimării este bună - dacă imprimați o fotografie de înaltă rezoluție pe modelul de top al oricărei linii de imprimante cu jet de cerneală, rezultatul va fi imposibil de distins de o fotografie obișnuită de x Probabil cea mai uimitoare invenție în tehnologia tipăririi de la Johann Gutenberg, care a inventat literele mobile în secolul al XV-lea, este imprimanta laser Acest dispozitiv combină calitatea bună a imprimării, versatilitatea, viteza mare și costul moderat Imprimantele laser folosesc aproape aceeași tehnologie ca și fotocopiatoarele Multe companii produc dispozitive care combină proprietățile unui copiator, imprimante și, uneori, un fax Schematic dispozitivul imprimantei este prezentat în fig Partea principală a acestei imprimante este un tambur rotativ (unele sisteme mai scumpe folosesc panglică în loc de tambur) Înainte ca fiecare coală să fie imprimată, tamburul primește o tensiune de aproximativ V și este înconjurat de un material fotosensibil Lumina laser se deplasează de-a lungul tamburului (în lungime), la fel ca un fascicul de electroni într-un tub cu raze catodice, doar că în loc de tensiune, o oglindă octogonală rotativă este folosită pentru a scana tamburul Fasciculul de lumină este modulat, rezultând un set de zone întunecate și luminoase Zonele lovite de fascicul își pierd sarcina electrică rotind foaie alba Ramă de coli imprimate Orez Cum funcționează o imprimantă laser După ce este trasată o linie de puncte, tamburul se rotește ușor pentru a crea următoarea linie Ca urmare, prima linie de puncte ajunge în rezervor cu toner (pulbere neagră electrostatică) Tonerul este atras de punctele încărcate și astfel se formează imaginea vizuală a liniei După un timp, tamburul de toner apasă pe hârtie, lăsând o amprentă a imaginii pe ea Foaia trece apoi prin role încălzite și imagine Intrare ieșire e reparat După aceea, tamburul este descărcat și tonerul rămas este curățat de acesta După aceea, este gata să imprime următoarea pagină Inutil să spun că acest proces este o combinație extrem de complexă de tehnici care necesită cunoștințe de fizică, chimie, mecanică și optică Electronica imprimantelor laser consta dintr-un procesor rapid și câțiva megaocteți de memorie pentru a stoca imaginea completă bitmap și diverse fonturi, unele încorporate și altele încărcate din memorie Majoritatea imprimantelor primesc comenzi care descriu pagina de tipărit (spre deosebire de imprimantele care primesc imagini bitmap de la CPU) Aceste comenzi sunt de obicei date în PCL HP sau PostScript Adobe Imprimantele laser cu o rezoluție de dpi și mai mare pot imprima fotografii alb-negru, dar tehnologia este mult mai complexă decât ar părea la prima vedere Luați în considerare o fotografie scanată la dpi care trebuie tipărită pe o imprimantă cu aceeași rezoluție ( dpi) Imaginea scanată conține x pixeli pe inch, fiecare pixel având o scară de gri specifică de la (alb) la (negru) Imprimanta poate imprima la dpi, dar fiecare pixel imprimat poate fi fie negru (când există toner), fie alb (când nu există toner) Tonuri de gri nu pot fi imprimate La imprimarea unor astfel de imagini, are loc așa-numita procesare semiton (ca la tipărirea posterelor în serie) Imaginea este împărțită în celule, fiecare de x pixeli Fiecare celulă poate conține de la la de pixeli negri Pentru ochiul uman, o celulă cu mai mulți pixeli negri pare mai întunecată decât o celulă cu mai puțini pixeli negri Tonurile de gri de la la sunt transmise după cum urmează Acest interval este împărțit în de zone Cenușii de la la sunt în zona , de la la sunt în zona și așa mai departe (zona este puțin mai mică decât celelalte, deoarece nu este divizibil cu ) Când tonurile zonei se întâlnesc, celula rămâne albă, așa cum se arată în Fig a Tonurile din zona sunt reprezentate de un pixel negru per celulă Tonuri Zona - doi pixeli pe celulă, așa cum se arată în fig b Imaginile de tonuri de gri ale altor zone sunt prezentate în fig , , in-e Dacă o fotografie este scanată la dpi, rezoluția imaginii imprimate este redusă la dpi după procesarea semitonurilor Această valoare se numește gradație de semiton și se măsoară în Ірі (linii pe inch - linii pe inch) Orez Imaginea semitonurilor gri din diferite zone: - (a); - (b); - (a); - (d); - (e); - (e) Capitolul Organizarea sistemelor informatice Imprimante color Imaginile color pot fi construite în două moduri: absorbția luminii și reflectarea luminii Absorbția luminii are loc, de exemplu, atunci când se creează imagini în monitoare cu raze catodice În acest caz, imaginea este construită prin suprapunerea a trei culori primare: roșu, verde și albastru Lumina reflectată este folosită pentru a crea fotografii color și imagini în reviste lucioase În acest caz, lumina cu o anumită lungime de undă este absorbită, iar restul luminii este reflectată Astfel de imagini sunt create prin suprapunerea substractive a trei culori primare: cyan (roșul este complet absorbit), galben (albastrul este complet absorbit) și magenta (verdele este complet absorbit) Teoretic, amestecând cerneala cyan, galbenă și magenta, puteți obține orice culoare Dar în practică este foarte dificil să obții o astfel de cerneală care să absoarbă complet toată lumina și, ca urmare, să dea o culoare neagră Din acest motiv, aproape toate imprimantele color folosesc patru culori de cerneală: cyan (Cyap), galben (galben), liliac (Magenta) și negru (NacK) Acest model de culoare se numește CYMK (ultima literă este luată din cuvântul "Yask" pentru a-l deosebi de cuvântul "Yne" din modelul RGB) Monitoarele, pe de altă parte, folosesc lumina absorbită și o suprapunere de roșu, verde și albastru pentru a crea o imagine color Setul complet de culori pe care le poate produce un monitor sau o imprimantă se numește diagramă de culori Nu există un astfel de dispozitiv care să transmită complet culorile lumii din jurul nostru În cel mai bun caz, dispozitivul oferă doar de grade de intensitate a fiecărei culori, iar în final se obțin doar de culori diferite Imperfecțiunea tehnologiei reduce și mai mult acest număr, iar culorile rămase nu oferă spectrul complet de culori În plus, percepția culorii este asociată nu numai cu proprietățile fizice ale luminii, ci și cu activitatea "tijelor" și "conurilor" din retină Din toate acestea rezultă că este foarte dificil să transformi o imagine color frumoasă, care arată grozav pe ecran, într-o imagine imprimată identică Printre principalele probleme se numără următoarele: + monitoarele color folosesc lumina absorbita; imprimante color - reflectate; ♦ tubul catodic oferă de nuanțe pentru fiecare culoare, imprimantele color trebuie să poată procesa semitonuri; + monitoarele au un fundal întunecat; hârtie - ușoară; ♦ Modelele de culoare RGB și CYMK sunt diferite unele de altele Pentru ca imaginile tipărite color să se potrivească cu realitatea (sau cel puțin cu imaginile de pe ecran), sunt necesare calibrarea echipamentelor, software sofisticat și competența utilizatorului Pentru imprimarea color sunt utilizate cinci tehnologii, toate fiind bazate pe modelul color CYMK Cele mai ieftine sunt imprimantele cu jet de cerneală color Ele funcționează la fel ca imprimantele cu jet de cerneală monocrome, dar în loc de un cartuș au patru (pentru cerneală cyan, galbenă, magenta și neagră) Imprimă bine grafica color, imprimă fotografii tolerabil Intrare ieșire decantor și nu sunt foarte scumpe (rețineți că, deși imprimantele în sine sunt ieftine, cartușele sunt destul de scumpe) Pentru rezultate optime, trebuie utilizate cerneală specială și hârtie specială Există două tipuri de cerneală Cernelurile pe bază de coloranți constau din coloranți dizolvați într-un mediu lichid Acestea oferă culori strălucitoare și ies cu ușurință din cartus Principalul dezavantaj al unor astfel de cerneluri este că se estompează rapid sub influența razelor ultraviolete, care se găsesc în lumina soarelui Cernelurile pe bază de pigment conțin particule solide de pigment scufundate într-un lichid Lichidul se evaporă din hârtie, dar pigmentul rămâne Cerneala nu se estompează, dar nu produce culori la fel de strălucitoare precum cernelurile pe bază de colorant În plus, particulele de pigment înfunda adesea orificiile de evacuare ale cartuşelor, astfel încât acestea trebuie curățate periodic Fotografiile necesită hârtie cretată sau lucioasă Aceste tipuri speciale de hârtie sunt special concepute pentru a reține picăturile de cerneală și pentru a preveni sângerarea acestora Următorul tip de imprimante sunt imprimantele cu cerneală solidă Aceste imprimante conțin blocuri solide de cerneală specială de ceară, care sunt apoi topite, ceea ce necesită minute (timpul necesar pentru ca cerneala să se topească) înainte de a începe imprimarea Cerneala fierbinte este pulverizată pe hârtie, unde se solidifică și se întărește după trecerea foii între două role Al treilea tip de imprimante color sunt imprimantele laser color Funcționează la fel ca omologii lor monocromi, doar că produc patru imagini separate (cian, galben, magenta și negru) și folosesc patru toneruri diferite Deoarece o imagine bitmap completă este de obicei pre-compusă, o imagine de x dpi pe o foaie de de inci pătrați necesită milioane de pixeli Deoarece fiecare pixel este format din biți, imprimanta are nevoie de MB de memorie doar pentru a stoca imaginea sub formă de biți, fără a lua în calcul memoria necesară procesoarelor interne, fonturilor etc Această cerință face ca imprimantele laser color să fie foarte scumpe, dar acestea funcționează foarte repede și oferă o imprimare de înaltă calitate În plus, imaginile rezultate sunt stocate pentru o perioadă lungă de timp Al patrulea tip de imprimante sunt imprimantele cu cerneală de ceară Acestea conțin o bandă largă de ceară în patru culori, care este împărțită în secțiuni de dimensiunea unei foi de hârtie Mii de elemente de încălzire topesc ceara pe măsură ce hârtia trece pe sub panglică Ceara este fixată pe hârtie sub formă de pixeli în conformitate cu modelul de culoare CYMK Aceste imprimante au fost cândva foarte populare, dar acum au fost înlocuite de alte tipuri de imprimante cu consumabile mai ieftine Al cincilea tip de imprimante se bazează pe tehnologia de sublimare Acest cuvânt evocă unele note freudiene , totuși, în știință, sublimarea este înțeleasă ca Sublimarea în psihologie înseamnă procesul mental de transformare și comutare a energiei pulsiunilor în scopul activității sociale și al creativității culturale; termenul a fost introdus de Freud - Notă transl Capitolul Organizarea sistemelor informatice trecerea solidelor la starea gazoasă ocolind stadiul lichid Un astfel de material este, de exemplu, gheața carbonică (dioxid de carbon înghețat) Într-o imprimantă de sublimare, un recipient de coloranți CYMK se deplasează peste un cap de imprimare termică care conține mii de elemente de încălzire programabile Coloranții se evaporă instantaneu și sunt absorbiți de hârtie specială Fiecare element de încălzire poate produce de temperaturi diferite Cu cât temperatura este mai mare, cu atât se depune mai mult colorant și culoarea este mai intensă Spre deosebire de toate celelalte imprimante color, această imprimantă este capabilă să reproducă culorile într-un spectru aproape continuu, deci nu este necesară procesarea semitonurilor Procesul de sublimare este adesea folosit la fabricarea așa-numitelor instantanee pe hârtie specială scumpă Echipamente de telecomunicații Majoritatea calculatoarelor moderne sunt conectate la rețele de calculatoare, dintre care Internetul este cel mai răspândit Pentru a accesa acest tip de rețele este nevoie de echipamente speciale Această secțiune discută cum funcționează astfel de echipamente Modemuri Odată cu creșterea numărului de computere în ultimii ani, a devenit necesară legarea lor între ele De exemplu, vă puteți conecta computerul de acasă la computerul de la serviciu, furnizorul de servicii de internet sau sistemul bancar O linie telefonică este adesea folosită pentru a asigura o astfel de comunicare Cu toate acestea, o linie telefonică obișnuită (precum și un cablu) este prost potrivită pentru transmiterea semnalelor computerului, în care corespunde de obicei la o tensiune zero și la o tensiune de până la volți (Fig , a) Semnalele de nivel dublu în timpul transmisiei printr-o linie telefonică destinată transmisiei vocale sunt supuse unor distorsiuni severe care conduc la erori de transmisie Cu toate acestea, un semnal sinusoidal cu o frecvență de până la Hz, numit purtător, poate fi transmis cu o distorsiune relativ mică, iar această proprietate este utilizată în transmisia de date în majoritatea sistemelor de telecomunicații Deoarece forma unei undă sinusoidală este complet previzibilă, nu conține nicio informație Cu toate acestea, prin schimbarea amplitudinii, frecvenței sau fazei, este posibilă transmiterea unei secvențe de zerouri și unu, așa cum se arată în Fig Acest proces se numește modulare Cu modulația de amplitudine, se folosesc niveluri de tensiune pentru și, respectiv, (Fig , b) Dacă datele digitale sunt transmise la o rată foarte scăzută, atunci se aude un zgomot puternic la o transmisie de și niciun zgomot la o transmisie de Cu modularea în frecvență, nivelul tensiunii nu se modifică, dar frecvențele semnalului purtător pentru și sunt diferite (Fig , c) În acest caz, la transmiterea datelor digitale, pot fi auzite două tonuri: unul dintre ele corespunde cu , iar celălalt cu Modulația de frecvență este uneori numită frecvență shift keying Intrare ieșire ÎN A b V G Ora -►- B i Înalt | i amplitudine i Frecventa inalta | Scăzut i amplitudinea frecventa joasa Orez Transmiterea în serie a unui număr binar printr-o linie telefonică: semnal cu două niveluri (a); modulația de amplitudine (b); modulația de frecvență (a); modulare de fază (a) Cu modularea de fază simplă, amplitudinea și frecvența sunt menținute la același nivel, iar faza semnalului purtător se modifică cu ° când datele se schimbă de la la sau de la la (Fig , d) În sistemele de modulație de fază mai complexe, la începutul fiecărei secțiuni de timp indivizibile, faza semnalului purtător este deplasată brusc cu , , sau ° pentru a transmite biți pe interval de timp Aceasta se numește codificare de fază dibit De exemplu, o schimbare de fază de ° reprezintă , ° reprezintă și așa mai departe Există sisteme pentru transmiterea a trei sau mai mulți biți într-o secțiune de timp Numărul de astfel de intervale de timp (adică numărul de modificări potențiale ale semnalului pe secundă) se numește baud rate Când transmiteți doi sau mai mulți biți într-o singură secțiune de timp, rata de biți va depăși rata de transmisie Rețineți că termenii "baud" și "bit" sunt adesea confundați în acest context Dacă datele constau dintr-o secvență de caractere de biți, ar fi de dorit să existe un mijloc de comunicare care să transmită câte biți odată, adică perechi de fire Deoarece liniile telefonice proiectate pentru transmisia vocală oferă un singur canal de comunicație, biții trebuie trimiși succesiv unul după altul (sau în grupuri de câte doi dacă se folosește codarea dibit) Un dispozitiv care primește caractere de la un computer sub formă de semnale cu două niveluri (câte un bit) și transmite biți unul sau doi sub formă de modulație în amplitudine, fază sau frecvență se numește modem Pentru a indica începutul și sfârșitul fiecărui caracter Capitolul Organizarea sistemelor informatice la începutul și sfârșitul șirului de biți, se setează biții de început și de sfârșit, deci se obține un total de biți Modemul trimite biți individuali ai fiecărui caracter la intervale regulate De exemplu, baud înseamnă că semnalul se schimbă la fiecare microsecunde Al doilea modem care primește informația convertește semnalul purtător modulat într-un număr binar Biții ajung la modem la intervale regulate Dacă modemul întâlnește începutul unui caracter, ceasul acestuia îi spune când să înceapă să citească biții primiti Modemurile moderne transmit date la viteze cuprinse între bps și bps, ceea ce corespunde în mod obișnuit unei rate mai mici de transmisie Ele combină diferite tehnologii pentru a transmite mai mulți biți pe baud prin modularea amplitudinii, frecvenței și fazei Aproape toate modemurile moderne sunt duplex, adică pot transmite informații în ambele direcții în același timp folosind frecvențe diferite Modemurile și liniile de comunicație care nu pot transmite informații în ambele direcții în același timp (precum o cale ferată cu o singură cale) sunt numite semi-duplex Liniile de comunicație care pot transmite informații într-o singură direcție se numesc simplex Linii digitale de abonat După ce au atins odată bara de kbps, inginerii companiei de telefonie cu un sentiment de realizare s-au odihnit pe lauri Între timp, furnizorii de servicii de televiziune prin cablu au început să ofere abonaților conexiuni la internet prin cabluri partajate la viteze de până la Mbps Furnizorii de servicii prin satelit au mers și mai departe, oferind conectivitate la viteze de peste Mbps Cu cât serviciile de acces la Internet au devenit mai importante pentru companiile de telefonie, cu atât au realizat că, pentru a rămâne competitive, trebuie să ofere pieței un fel de serviciu superior decât o conexiune convențională dial-up Ca urmare a acestor reflecții, a luat naștere un nou serviciu digital de acces la Internet Serviciile care oferă mai multă lățime de bandă decât o conexiune dial-up standard sunt uneori denumite bandă largă, dar sincer, acesta este mai mult un termen de marketing decât un termen tehnic de fond Inițial, au fost propuse mai multe tehnologii de acces sub denumirea generală xDSL (Digital Subscriber Line - digital subscriber line) cu valoare x variabilă În continuare, vom discuta despre cele mai comune dintre ele - ADSL (Asymmetric DSL - asymmetric digital subscriber line) Lucrările la ADSL sunt încă în desfășurare și nu toate standardele pentru această tehnologie au fost notate, așa că unele detalii pot fi ajustate în timp Cu toate acestea, imaginea de ansamblu este probabil să rămână neschimbată Pentru mai multe informații despre ADSL, vă rugăm să consultați literatura suplimentară [ , ] De ce modemurile obișnuite sunt atât de lente? Da, pentru că inițial telefoanele au fost concepute pentru a transmite vocea și tocmai cu acest scop a fost creat întregul sistem de comunicații telefonice Transmiterea datelor prin organism Intrare ieșire prea puțină atenție s-a acordat firelor de fundal Capacitatea firului (cunoscut și ca canal de abonat) care leagă abonații cu o centrală telefonică automată (ATS) era în mod tradițional limitată de un filtru special Debitul real al unui canal de abonat depinde în mare măsură de lungimea acestuia, dar cel mai adesea (dacă lungimea nu depășește câțiva kilometri) ajunge la , MHz Cea mai comună schemă de furnizare a serviciilor ADSL este prezentată în Fig Conținutul său se reduce la îndepărtarea filtrului și la separarea spectrului eliberat de , MHz în de canale autonome, fiecare la , Hz Canalul este dedicat datelor vocale Canalele - nu sunt utilizate, eliminând astfel interferența reciprocă a semnalelor de voce și date Din restul de de canale, două sunt alocate pentru transmiterea pe legătura ascendentă și descendentă a semnalelor de control Alte canale transmit datele utilizatorului Astfel, un modem ADSL este echivalent cu de modemuri obișnuite de canale la kHz Vocea ascendentă Downdraft curgere Orez Funcționarea ADSL În principiu, un flux de date duplex poate fi trimis prin fiecare dintre canalele rămase, totuși, armonicile auxiliare, diafonia și alte efecte fizice nu permit aducerea implementării efective a tehnologiei la un nivel teoretic Este la latitudinea furnizorului de servicii să decidă cât de mult să împartă canalele în aval și în amonte Este posibil din punct de vedere tehnic să existe o distribuție egală a acestor canale, dar în majoritatea cazurilor - % este alocată organizării din aval (de obicei, de canale sunt alocate în amonte, iar restul în aval), deoarece majoritatea utilizatorilor primesc mult mai multe date decât trimit Acesta este motivul pentru care tehnologia ADSL are atât de mult succes Calitatea transmisiei datelor pe fiecare canal este monitorizată constant și, dacă este necesar, corectată; Prin urmare, vitezele canalelor pot diferi Datele sunt transmise la până la biți/baud printr-o combinație de modulație de amplitudine și fază Dacă, de exemplu, de canale în aval sunt disponibile pentru transmisia de date, iar rata de semnalizare este de baud la bps, debitul total în aval este de , Mbps În practică, raportul semnal-zgomot nu permite abordarea acestui nivel, dar cu o distanță mică de furnizorul de servicii și o calitate ridicată a canalului, o viteză de - Mbps este destul de realizabilă O configurație tipică a echipamentului ADSL este prezentată în Figura Conform acestei scheme, o rețea inter- Capitolul Organizarea sistemelor informatice dispozitiv facial (Dispozitiv de interfață de rețea, NID) Această cutie mică de plastic simbolizează granița dintre proprietatea utilizatorului și proprietatea companiei de telefonie Lângă NID (și uneori în același caz cu acest dispozitiv) este instalat un splitter (splitter) - un filtru analogic care separă datele și semnalele la o frecvență de - Hz folosit pentru transmisia vocală Fluxul de date este trimis către modemul ADSL, iar semnalele vocale sunt trimise către telefon Modemul ADSL este un procesor de semnal digital care emulează funcționarea în paralel a de modemuri convenționale la frecvențe diferite Deoarece majoritatea modemurilor ADSL sunt produse extern, conexiunea lor la computer trebuie să fie suficient de rapidă De obicei, această cerință este îndeplinită prin instalarea unei plăci Ethernet în computer și stabilirea unei conexiuni Ethernet cu două legături la modemul ADSL (Ethernet este un standard comun și foarte accesibil de rețea locală ) Uneori, un modem ADSL este conectat la un computer printr-un port USB Pe viitor, ar trebui să ne așteptăm la apariția unor plăci speciale pentru conectarea la un modem ADSL Linie telefonica Orez Configurație standard a echipamentelor ADSL Pe partea opusă a canalului de abonat, este instalat un alt splitter, care separă semnalele vocale și le redirecționează către o centrală telefonică obișnuită Semnalele de peste kHz sunt transmise la un Multiplexor de acces la linia de abonat digital (DSLAM) După ce semnalele digitale sunt convertite într-un flux de biți, pachetele sunt formate și apoi trimise furnizorului de servicii Intrare ieșire Internet prin cablu Multe companii de televiziune oferă utilizatorilor posibilitatea de a accesa Internetul prin intermediul rețelelor de cablu Această tehnologie este oarecum diferită de ADSL, așa că ar trebui luată în considerare separat În posesia fiecărui operator de televiziune prin cablu, pe lângă biroul central, există un număr de noduri principale (săli cu echipamente electronice) dispersate în tot orașul Toate sunt conectate la sediul central prin cablu de bandă largă sau fibră optică Unul sau mai multe cabluri se extind de la fiecare nod principal la consumatorii finali Pentru ca un astfel de cablu să fie conectat, acesta trebuie să fie amplasat în apropierea incintei în care se află utilizatorii În același timp, sute de utilizatori sunt conectați la același cablu De regulă, lățimea de bandă a unui astfel de cablu este de aproximativ MHz După cum puteți vedea, diferența conceptuală dintre accesul prin cablu și tehnologia ADSL este absența unui canal individual conectat la biroul furnizorului de servicii Cu toate acestea, în practică, beneficiile de a avea propriul canal cu o lățime de bandă de , MHz, pe de o parte, și un canal comun cu încă patru sute de utilizatori cu o lățime de bandă totală de MHz, pe de altă parte, sunt aproximativ echivalente (acesta se explică prin faptul că la fiecare moment individual nu mai mult de jumătate din de utilizatori sunt online) Mai mult, în toiul nopții, internetul prin cablu funcționează mult mai rapid decât în timpul zilei, în timp ce rata de transfer de date pe canalul ADSL este aceeași pe tot parcursul zilei Logica este aceasta: pentru a obține un acces optim la Internet prin intermediul unui canal de cablu, trebuie să locuiți fie într-o zonă foarte bogată (unde casele sunt la o distanță mare una de cealaltă și, prin urmare, nu atât de mulți utilizatori sunt conectați la același cablu), sau într-o zonă foarte săracă (de unde nimeni nu își permite să achiziționeze un astfel de serviciu) Deoarece mai mulți utilizatori sunt conectați la un cablu, problema reală este reglarea timpului și a frecvenței consumului de lățime de bandă Pentru a înțelege cum se rezolvă această problemă, va trebui să faceți o scurtă digresiune în tehnologia televiziunii prin cablu În SUA, intervalul de frecvență - MHz este alocat pentru difuzarea canalelor prin cablu (cu toate acestea, intervalul - MHz, destinat posturilor de radio FM, este exclus din acesta) Fiecare canal ocupă MHz (inclusiv benzi de gardă pentru a preveni interferența între canalele adiacente) În Europa, pragul inferior al gamei de cablu este de MHz, iar canalele ocupă fiecare câte - MHz (din această cauză se asigură rezoluție crescută conform standardelor PAL / SECAM); în toate celelalte privințe, schema de distribuție a frecvenței este similară cu cea americană În ambele cazuri, partea inferioară a intervalului nu este utilizată pentru transmiterea semnalelor de televiziune Încercând să implementeze tehnologia de acces la Internet prin cablu, operatorii s-au confruntat cu două probleme: Cum să preveniți interferențele atunci când transmiteți date și semnal TV în același timp? Cum se organizează traficul bidirecțional cu amplificatoare unidirecționale? Capitolul Organizarea sistemelor informatice Soluțiile alese sunt următoarele Cablurile moderne funcționează la o frecvență mult peste MHz, ajungând la MHz sau mai mult Canalele de uplink (adică direcționate de la utilizator la headend) ocupă un interval de - MHz (în Europa este puțin mai mare), în timp ce frecvențele înalte sunt folosite pentru a transmite traficul în aval (de la headend către utilizator) (Fig ) ) o/ I și MHz SI shr si TV Frecvențele downlink f n o; Ha eu f & Orez Alocarea frecvenței într-un sistem standard de televiziune prin cablu cu acces la Internet Vă rugăm să rețineți că, deoarece semnalele TV sunt transmise exclusiv în direcția în aval, amplificatoarele în amonte pot funcționa numai în intervalul - MHz, iar amplificatoarele în aval în intervalul de MHz și mai mare Astfel, debitul celor două direcții este asimetric, deoarece intervalul din amonte este mult mai mic decât cel din aval Cu toate acestea, această împrejurare nu deranjează prea mult operatorii de cablu, întrucât traficul este transmis în mare parte utilizatorului, și nu de la acesta Până la urmă, companiile de televiziune au avut succes și în furnizarea de servicii DSL cu acces asimetric, deși nu există restricții tehnice privind traficul în amonte Modemurile prin cablu sunt folosite pentru a conecta utilizatorul final la Internet Acestea sunt dispozitive cu două interfețe - pentru conectarea la un computer, pe de o parte, și la o rețea de cablu, pe de altă parte Interfața computer-cablu-modem este simplă - ca și în cazul ADSL, o rețea Ethernet miniaturală este organizată pentru transmiterea datelor În viitor, modemurile prin cablu vor fi realizate cel mai probabil ca plăci instalate în unitatea de sistem, așa cum sa întâmplat cu modemurile interne V x Pe partea opusă, sunt instalate echipamente mai sofisticate Standardele de cablare sunt un subiect din domeniul ingineriei radio și, prin urmare, luarea în detaliu a acestuia în contextul nostru pare inadecvată Singurul lucru care merită remarcat este funcționarea continuă a modemurilor prin cablu - în acest sens seamănă cu modemurile ADSL Conexiunea este stabilită și menținută în mod constant și este întreruptă numai atunci când alimentarea cu energie electrică este oprită - acest lucru se datorează faptului că operatorii de rețele de cablu nu percep o taxă de timp pentru serviciile lor Intrare ieșire Luați în considerare succesiunea operațiunilor care apar la conectarea și pornirea modemului În primul rând, modemul scanează conținutul legăturilor în jos pentru un pachet special care este trimis la intervale regulate de la headend și care conține parametrii de sistem pentru modemurile recent conectate După ce a găsit unul, modemul își anunță prezența într-unul dintre uplink-uri Headend-ul atribuie apoi legături în sus și în jos specifice modemului Ulterior, dacă headend-ul consideră că este necesar să echilibreze sarcina, alte canale pot fi alocate modemului Modemul determină apoi distanța până la headend, trimițându-i un pachet special și calculând timpul de răspuns Acest proces se numește calibrare (ranging) Cunoscând distanța până la headend, modemul poate ajusta uplink-urile în consecință Faptul este că fluxul de date din amonte este împărțit în intervale de timp sau minisloturi Fiecare pachet din amonte trebuie să se încadreze într-unul sau mai multe mini-sloturi consecutive Headend-ul trimite în mod regulat notificări despre începutul noilor cicluri de minislot, dar deoarece modemurile sunt la distanțe diferite de nodul principal, primesc aceste notificări la momente diferite În același timp, știind cât de departe este de nodul principal, modemul poate calcula ora reală de pornire a mini-slot Lungimea mini-slotului este determinată de caracteristicile rețelei particulare Sarcina utilă a unui mini-slot este de obicei de octeți În timpul inițializării, headend-ul leagă fiecare modem la un anumit mini-slot, ca urmare, are posibilitatea de a trimite cereri de lățime de bandă În mod obișnuit, mai multe modemuri sunt legate la același mini-slot, ceea ce duce la dispute Înainte ca un pachet să fie trimis de la computer la rețea, acesta este trecut la modem, care apoi solicită numărul corespunzător de mini-sloturi Dacă cererea este acordată, nodul principal trimite o confirmare pe legătura descendentă indicând mini-sloturile rezervate pentru transmiterea pachetelor Mai departe, pornind de la primul mini-slot rezervat, începe trimiterea Solicitările de trimitere a pachetelor suplimentare sunt încorporate într-un câmp special de antet Dacă modemul nu primește o confirmare din cauza disputei pentru mini-slot solicitat, așteaptă o perioadă de timp aleatorie și repetă cererea Cu fiecare încercare nereușită, timpul de așteptare se dublează, contribuind la scurgerea traficului intens Legăturile în jos sunt gestionate diferit În primul rând, într-o transmisie în aval, există un singur expeditor - nodul principal Prin urmare, nu există nicio dispută, precum și necesitatea de a aloca mini-slot, care, în esență, nu este altceva decât un mijloc de multiplexare statistică a diviziunii în timp În al doilea rând, traficul în aval este de obicei mult mai intens decât traficul în amonte, deci este transmis în pachete de de octeți Pachetul, pe lângă sarcina utilă de de octeți, include codul de corectare a erorilor Reed-Solomon și alte câmpuri de serviciu Această dimensiune a pachetului este aleasă pentru compatibilitatea cu televiziunea digitală MPEG- - Capitolul Organizarea sistemelor informatice ca rezultat, canalele de legătură în jos ale semnalului de televiziune și ale datelor sunt formatate uniform Schema logică a acestor conexiuni este prezentată în fig Fibra optica Coaxial Downlink fără contestație: cablu de Mbps folosind tehnologia QAM- la transmiterea pachetelor cu o sarcină utilă de de octeți Legătură ascendentă de pachete litigioase: Mbps QPSK pe mini-sloturi de octeți Orez Organizarea standard a uplink-urilor și downlink-urilor în SUA Tehnologia QAM- (Quadrature Amplitude Modulation) permite transmisia la biți/Hz, dar funcționează doar la frecvențe înalte Tehnologia QPSK (modulație de fază în quadratură) funcționează la frecvențe joase, dar rata maximă de transmisie este de bps Modem Cu toate acestea, să revenim la procedura de inițializare a modemului După calibrare, primire uplink și downlink și atribuire mini-sloturi, modemul poate începe să transmită pachete Pachetele sunt trimise către headend, de la care merg printr-un canal dedicat către biroul central al operatorului de televiziune prin cablu, iar de acolo către furnizorul de servicii de internet (ISP), în calitate de operator însuși Primul pachet trimis furnizorului de servicii conține o solicitare de a furniza în mod dinamic o adresă de rețea (adresă IP) O altă întrebare din acest pachet se referă la ora exactă a zilei Următorul pas este abordarea problemelor de securitate Mulți utilizatori își transmit datele printr-un singur cablu (dacă sunteți interesat, încercați să vă uitați la statisticile privind traficul de trecere) Pentru a preveni ca vecinii să se urmărească reciproc, tot traficul, indiferent de direcția în care este trimis, este criptat fără greșeală Prin urmare, în timpul procesului de inițializare, printre altele, sunt determinate cheile de criptare S-ar părea că este imposibil să se negocieze o cheie secretă între modem și nodul principal sub privirea atentă a mii de utilizatori De fapt, acesta nu este cazul - algoritmul Diffie-Hellman [ ] este folosit pentru a determina cheia de criptare În cele din urmă, modemul se înregistrează în rețea și își comunică identificatorul unic printr-un canal securizat Acest lucru completează procesul de inițializare - utilizatorul poate începe să lucreze Revizuirea noastră a modemurilor prin cablu s-a dovedit a fi destul de concisă Consultați literatura suplimentară pentru detalii [ , , ] Intrare ieșire Camere digitale Din ce în ce mai multe tehnologii informatice sunt introduse în domeniul fotografiei digitale - chiar și acum camerele digitale sunt considerate în mod destul de legitim ca unul dintre tipurile de periferice pentru computer Să aruncăm o privire rapidă asupra modului în care funcționează Toate camerele sunt echipate cu un obiectiv care formează o imagine a obiectului din spatele camerei Într-o cameră tradițională, filmul fotografic acționează ca un purtător de imagini latente care se formează în momentul pătrunderii luminii Imaginile sunt dezvoltate în laborator prin expunerea la anumite elemente chimice Principiul de funcționare al unei camere digitale este similar cu o excepție - în loc de film, purtătorul de imagine devine o matrice dreptunghiulară de dispozitive fotosensibile cuplate la sarcină (Charge-Coupled Devices, CCD) (Unele camere digitale folosesc tehnologia CMOS, dar varianta CCD este mai comună ) Când lumina lovește un dispozitiv CCD, acesta primește o încărcare electrică Cu cât este mai multă lumină, cu atât este mai mare schimbarea încărcăturii Taxa este citită de convertorul analog-digital ca un număr întreg de la la (aparate foto cu preț redus) sau de la la (aparate reflex cu un singur obiectiv) Circuitul corespunzător este prezentat în Fig Un pixel este format pe baza valorilor a patru dispozitive CCD - unul roșu, unul albastru și două verzi Matricea dispozitivelor CCD CPU Memorie flash sau microdisc Camera digitala Orez Camera digitala Fiecare dispozitiv CCD, indiferent de lumina care cade pe el, generează o singură valoare de ieșire Pentru imagini color Capitolul Organizarea sistemelor informatice Dispozitivele CCD sunt grupate în grupuri de patru Un filtru Bayer este plasat deasupra grupului, ceea ce face ca un dispozitiv CCD să fie sensibil la roșu, celălalt la albastru și celelalte două la verde Prezența a două elemente verzi se explică prin doi factori: în primul rând, este mai convenabil, iar în al doilea rând, ochiul uman percepe verdele mai bine decât albastrul și roșu Dacă producătorul unei camere digitale susține că rezoluția acesteia este de milioane de pixeli, trebuie să știi că minte obrăzător Are milioane de dispozitive CCD, care împreună formează , milioane de pixeli Cu această rezoluție, imaginea este citită ca o matrice de x (în camerele ieftine) sau x (în camerele reflex cu un singur obiectiv) pixeli Pixelii suplimentari sunt generați prin interpolare software Când apăsați butonul de declanșare a obiectivului, software-ul camerei efectuează trei operații: setează focalizarea, determină expunerea și efectuează echilibrarea albului Focalizarea automată este realizată prin analiza datelor de imagine de înaltă frecvență și împingerea obiectivului la limita pentru detalii maxime La determinarea expunerii, se calculează mai întâi intensitatea luminii care cade pe CCD, după care se reglează diafragma și viteza obturatorului astfel încât valoarea intensității rezultată să scadă la mijlocul intervalului CCD Echilibrarea albului se reduce la măsurarea spectrului luminii incidente în scopul corecției ulterioare a culorii Apoi, imaginea este citită de pe CCD și stocată ca o matrice de pixeli în memoria RAM încorporată a camerei Aparatele foto reflex profesionale cu un singur obiectiv utilizate de fotojurnalişti pot filma opt cadre de înaltă rezoluţie pe secundă timp de cinci secunde; în același timp, cantitatea de RAM încorporată, în care imaginile sunt plasate înainte de procesarea ulterioară și stocarea permanentă, este destul de mare În camerele ieftine, memoria RAM este mai mică, dar suficientă După realizarea unei fotografii, software-ul efectuează corecția culorilor pe baza balansului de alb, neutralizând astfel excesul de lumină roșie sau albastră (care apare, de exemplu, atunci când fotografiați un subiect la umbră, precum și când utilizați un bliț) Apoi se efectuează algoritmi pentru reducerea zgomotului și corectarea dispozitivelor CCD defecte După aceea (dacă funcția corespunzătoare este activată), se încearcă ascuțirea imaginii - caută margini și crește intensitatea gradientului din jurul lor În cele din urmă, imaginea este comprimată pentru a reduce cantitatea de memorie pe care o ocupă Cel mai comun format folosit în acest scop este JPEG (Joint Photographic Experts Group) Acesta oferă o transformată Fourier spațială bidimensională și eliminarea componentelor de înaltă frecvență Imaginea finală este foarte compactă, dar detaliile fine se pierd La sfârșitul procesării, imaginea este scrisă pe un suport permanent, care este de obicei un card de memorie flash sau un mic dispozitiv detașabil Intrare ieșire Hard disk-ul este cunoscut și sub numele de microdisc Procesarea și înregistrarea fiecărei imagini durează câteva secunde Utilizatorul poate apoi conecta camera la computer prin, de exemplu, un cablu USB sau FireWire Acest lucru vă permite să transferați imagini din memoria camerei pe hard diskul computerului Cu ajutorul unui software special (de exemplu, editorul Adobe Photoshop), utilizatorul poate decupa imaginea, regla luminozitatea, contrastul și echilibrul, crește claritatea sau, dimpotrivă, poate estompa parțial imaginea, elimina elementele inutile și poate aplica filtre într-un mod arbitrar combinaţie Mulțumit de rezultat, utilizatorul este liber să imprime imaginile pe o imprimantă color, să le posteze pe Internet și să le inscripționeze pe un CD sau DVD pentru arhivare sau imprimare ulterioară În ceea ce privește puterea de calcul, cantitatea de RAM și spațiul pe disc, precum și complexitatea software-ului, camerele digitale reflex cu un singur obiectiv (Single-Lens Reflex, SLR) sunt comparabile cu sistemele desktop de acum doi sau trei ani Pe lângă operațiunile de mai sus, computerul unei astfel de camere trebuie să asigure interacțiunea cu lentilele și procesorul blitzului, să actualizeze imaginea de pe ecranul cu cristale lichide, fără a mai vorbi de coordonarea acțiunilor tuturor butoanelor, roților, indicatoarelor, afișajelor și alte dispozitive în timp real Codurile de caractere Fiecare computer are un set de caractere pe care îl folosește Cel puțin, acest set include de litere mari și de litere minuscule , numere de la la și câteva caractere speciale, inclusiv spațiu, punct, virgulă, minus, întoarcere transport etc Pentru a transmite aceste caractere către un computer, fiecăruia i se atribuie un număr, de exemplu: a = , b = , , z = , + = , - = Reprezentarea unui caracter ca număr întreg se numește cod de caractere Este important de reținut că computerele interconectate trebuie să accepte aceleași coduri de caractere, altfel nu vor putea face schimb de informații Din acest motiv, au fost elaborate standarde Aici ne vom uita la cele două cele mai importante ASCII Unul dintre cele două coduri utilizate în mod obișnuit se numește ASCII (American Standard Code for Information Interchange) Fiecare caracter ASCII conține biți, astfel încât un total de de caractere pot fi codificate Codurile de la la F (hexazecimal) corespund caracterelor de control care nu sunt tipărite (Tabelul ) În engleză - Notă transl Capitolul Organizarea sistemelor informatice Tabelul Tabel de coduri pentru caracterele de control ASCII Număr Nume Valoare Număr Nume Valoare NUL Zero DLE Data Link Escape SOH Începutul antetului Controlul dispozitivului DC STX Start of Text DC Device Control ETX Sfârșitul textului Controlul dispozitivului DC EOT Sfârșitul transmisiei Controlul dispozitivului DC Întrebare ENQ Recunoaștere negativă NAK ACK ACKnoligement SYN SYNcronous inactiv (Pauză) BEL Beli (Beep) ETB Sfârșitul blocului de transmisie BS BackSpace (Backback) CAN Cancel (Anulare) HT Filă orizontală EM Sfârșitul mediului A LF Line Feed A SUB Substitut (subscript) Â VT Fila verticală (tabulare verticală) Â ESC ESCape (Ieșire) С FF din flux (traducere pagină) С FS File Separator (separator de fișiere) D CR Carage Return D GS Group Separator E SO Shift Out E RS Record Separator F SI Shift In F US Unit Separator Intrare ieșire Multe caractere de control ASCII sunt pentru transmisia de date De exemplu, un mesaj poate consta din caracterul SOH (Start of Header), antetul în sine, caracterul STX (Start of Text), textul însuși, caracterul ETX (End of Text) și în final EOT (sfârșitul textului) transmitere) Cu toate acestea, în practică, mesajele trimise prin linii telefonice și rețele sunt formatate diferit, astfel încât caracterele de control ASCII sunt cu greu utilizate pentru transmisie Caracterele ASCII imprimabile includ litere mari și mici, numere, semne de punctuație și unele simboluri matematice (Tabelul ) Tabelul Tabel de coduri pentru caracterele ASCII imprimabile Număr Simbol Număr Simbol Număr Număr Simbol Număr Simbol Număr Simbol Număr Simbol (spațiu) @ P P A Q a Q V R b R # S S S S $ D T d T % E și e u & F V f V G W g W ( N X h X ) I Y i Y A * PENTRU A J A Z A j A z V + ZV V K V [ V k B { C C E N E l E n E F / F? F O F F F DEL UNICODE Industria calculatoarelor s-a dezvoltat predominant în SUA, rezultând un cod ASCII mai potrivit pentru engleză decât pentru alte limbi Franceza are accente, germana are umlauts și așa mai departe Unele limbi europene au câteva litere care nu sunt în setul de caractere ASCII Unele limbi au un alfabet complet diferit (cum ar fi rusă sau arabă), iar unele nu au deloc un alfabet (cum ar fi chineza) Calculatoarele s-au răspândit în toată lumea, iar furnizorii de software vor să-și vândă produsele fără Capitolul Organizarea sistemelor informatice numai în țările vorbitoare de engleză, dar și în acele țări în care majoritatea utilizatorilor nu vorbesc engleza și este nevoie de un set de caractere diferit Prima încercare de extindere a codului ASCII a fost IS , care a adăugat încă de caractere la setul de caractere ASCII, rezultând un set de caractere de biți numit Latin- Au fost adăugate în mare parte litere latine cu linii și semne diacritice Următoarea încercare a fost standardul IS , care a introdus conceptul de pagină de cod O pagină de coduri este un set de de caractere pentru o anumită limbă sau un grup de limbi, în IS - acesta este setul Latin-І IS - include limbi slave cu alfabet latin (de exemplu, cehă, poloneză și maghiară), IS - descrie caractere pentru turcă, malteză, galică, esperanto etc Principalul dezavantaj al acestei abordări este că software-ul Software-ul trebuie să controleze cu ce pagină de cod are de-a face, iar amestecarea limbilor este inacceptabilă De asemenea, acest sistem nu acoperă japoneză și chineză Un grup de companii de calculatoare au rezolvat această problemă prin crearea unui nou sistem de codare numit UNI CODE și au declarat acest sistem standard internațional (IS ) UNICODE este suportat de unele limbaje de programare (cum ar fi Java), unele sisteme de operare (cum ar fi Windows NT) și multe aplicații Este probabil ca acest sistem să se răspândească în întreaga lume Ideea de bază a UNICODE este de a atribui fiecărui caracter o singură valoare constantă de biți, care se numește indicator de cod Caracterele multiocteți și caracterele wildcard nu sunt utilizate Deoarece fiecare caracter are o lungime de biți, scrierea software-ului este mult mai ușoară Deoarece caracterele UNICODE au o lungime de biți, există în total de puncte de cod Deoarece toate limbile din lume au un total de aproximativ de caractere, punctele de cod sunt o resursă foarte rară care trebuie alocată cu mare grijă Aproximativ jumătate din coduri au fost deja distribuite, iar consorțiul care a dezvoltat UNICODE ia în considerare în mod constant propuneri pentru distribuirea restului Pentru a accelera adoptarea sistemului UNICODE, consorțiul a folosit setul Latin-I pentru codurile de la la , care oferă o conversie ușoară de la caracterele ASCII- în UNICODE Pentru a evita risipa de coduri, fiecare diacritic are propriul cod, iar combinarea unui diacritic cu o anumită literă este sarcina software-ului Întregul set de coduri este împărțit în blocuri, fiecare bloc conține coduri Fiecare alfabet din UNICODE are un număr de zone consecutive Iată câteva exemple (numărul de coduri implicate este indicat între paranteze): latină ( ), greacă ( ), rusă ( ), armeană ( ), ebraică ( ), Devanagari ( ), Gurmuk ( ) , Oriya ( ) ), Telugu ( ) și Kannada ( ) Rețineți că fiecăreia dintre aceste limbi i se atribuie mai multe coduri decât litere Acest lucru se datorează parțial pentru că, în multe limbi, fiecare literă are mai multe ortografii De exemplu, fiecare literă în limba engleză este reprezentată în două versiuni: există litere mici și mari În unele limbi, literele au trei sau mai multe forme de scriere, alegerea unei anumite variante depinde de locul în care se află litera: la începutul, sfârșitul sau mijlocul cuvântului Rezumatul capitolului În plus, unele coduri au fost atribuite semnelor diacritice ( ), semnelor de punctuație ( ), subscriptelor și superscriptelor ( ), semnelor valutare ( ), simbolurilor matematice ( ), figurilor geometrice ( ), desenelor ( ) De asemenea, aveți nevoie de caractere pentru chineză, japoneză și coreeană Mai întâi vin de caractere fonetice (cum ar fi katakana și bopomofo), apoi caracterele folosite în chineză și japoneză ( ), apoi silabele coreene ( ) Pentru ca utilizatorii să creeze personaje noi în scopuri speciale, există încă de coduri Deși sistemul UNICODE a rezolvat multe dintre problemele asociate internaționalizării, tot nu a rezolvat absolut toate problemele De exemplu, alfabetul latin este ordonat, dar caracterele nu sunt, așa că un program în limba engleză poate alfabetiza cuvintele "pisică" și "câine" comparând semnificația codurilor primelor litere, dar un program japonez are nevoie de tabele suplimentare pentru a să poată calcula, în ordinea în care caracterele sunt în dicționar O altă problemă este că apar în mod constant cuvinte noi Acum de ani nimeni nu vorbea despre applet-uri, cyberspace, gigabytes, lasere, modemuri, emoticoane sau casete video Apariția unor cuvinte noi în engleză nu necesită coduri noi, dar în japoneză sunt necesare Pe lângă noile termeni, trebuie adăugate și cel puțin de noi nume proprii și nume de locuri (în mare parte chinezești) Braille, care este folosit de nevăzători, ar trebui probabil inclus și Reprezentanții diferitelor comunități profesionale sunt, de asemenea, interesați de prezența anumitor simboluri speciale Consorțiul UNICODE analizează și decide asupra tuturor propunerilor noi Sistemul UNICODE folosește același cod pentru caractere care arată aproape la fel, dar au mai multe semnificații sau sunt scrise ușor diferit în chineză și japoneză (ca și cum procesoarele de text în engleză ar fi scris întotdeauna "blow" ca "blow", deoarece sunt pronunțate la fel) Unii consideră că această abordare este optimă pentru salvarea unei surse slabe de coduri, alții o văd drept imperialism cultural anglo-saxon (credeți că alocarea de valori pe biți caracterelor nu era politică?) Treaba este complicată de faptul că dicționarul japonez complet conține de caractere (fără a număra numele proprii), așa că, cu de coduri, trebuie să faci alegeri și să sacrifici ceva Nu toți japonezii cred că un consorțiu de companii de calculatoare, chiar dacă unele dintre ele sunt japoneze, este locul ideal pentru a decide ce să sacrifice Rezumatul capitolului Sistemele informatice sunt alcătuite din trei componente: procesoare, memorie și dispozitive de intrare/ieșire Scopul procesorului este de a apela secvenţial instrucţiuni din memorie, de a le decoda şi de a le executa Ciclu Capitolul Organizarea sistemelor informatice apel - decodare - execuție poate fi întotdeauna reprezentată ca un algoritm Apelarea, decodarea și executarea instrucțiunilor unui anumit program sunt uneori efectuate de un program interpret care rulează la un nivel inferior Pentru a îmbunătăți performanța, multe computere au una sau mai multe conducte sau suportă o arhitectură superscală cu mai multe blocuri funcționale care funcționează în paralel Sistemele cu procesoare multiple sunt răspândite Calculatoarele cu procesare paralelă includ procesoare matrice, în care aceeași operațiune este efectuată simultan pe seturi diferite de date; multiprocesoare, în care mai multe procesoare au o memorie comună; și multicalculatoare, în care fiecare computer are propria sa memorie, dar calculatoarele sunt interconectate și își trimit mesaje unul altuia Memoria poate fi împărțită în primară și secundară Memoria principală este folosită pentru a stoca programe care rulează în prezent Timpul de acces este scurt (cel mult câteva zeci de nanosecunde) și nu depinde de adresa accesată Memoria cache reduce și mai mult timpul de acces Memoria poate fi echipată cu un cod de corectare a erorilor pentru a îmbunătăți fiabilitatea Timpul de acces la memoria auxiliară, pe de altă parte, este mult mai lung (de la câteva milisecunde și mai mult) și depinde de locația datelor citite și scrise Cele mai comune tipuri de stocare auxiliară sunt benzile magnetice, discurile magnetice și discurile optice Discurile magnetice sunt disponibile în mai multe varietăți: dischete, hard disk, discuri IDE, discuri SCSI și matrice RAID Discurile optice includ CD-uri, CD-R și DVD-uri Dispozitivele I/O sunt folosite pentru a transfera informații către și de la un computer Acestea sunt conectate la procesor și memorie prin una sau mai multe magistrale Exemplele includ terminale, șoareci, imprimante și modemuri Majoritatea dispozitivelor I/O folosesc cod ASCII, deși UNICODE se răspândește deja rapid în întreaga lume Întrebări și sarcini Luați în considerare o mașină cu calea datelor prezentată în fig Să presupunem că încărcarea registrelor ALU durează ns, rularea ALU durează ns, iar repunerea rezultatului în registru durează ns Care este numărul maxim de milioane de instrucțiuni pe secundă pe care această mașină este capabilă să le execute în absența unei conducte? De ce este necesar pasul în lista de pași din secțiunea Executarea comenzilor din secțiunea Procesoare? Ce se întâmplă dacă acest pas este omis? Pe computerul , fiecare instrucțiune durează ns pentru a fi finalizată, iar pe computerul durează ns Poti spune cu certitudine ca computerul este mai rapid? Justificati raspunsul Întrebări și sarcini Să presupunem că proiectați un computer cu un singur cip pentru a fi utilizat în sistemele încorporate Toată memoria este pe un cip și funcționează la aceeași viteză ca procesorul Examinați principiile prezentate în subsecțiunea "Principii de proiectare pentru calculatoare moderne" din secțiunea "Procesoare" și spuneți dacă sunt importante în acest caz (performanța ridicată este de dorit) În unele calcule, fiecare pas ulterior depinde de cel anterior Ce este mai potrivit de utilizat în acest caz, un procesor matrice sau o conductă? Explică de ce Pentru a concura cu tipografia nou inventată, o mănăstire medievală a decis să producă în masă cărți scrise de mână Pentru a face acest lucru, un număr mare de cărturari s-au adunat într-o sală mare Starețul mănăstirii a chemat primul cuvânt al cărții și toți cărturarii l-au notat Atunci starețul a chemat al doilea cuvânt și toți cărturarii l-au notat Acest proces a fost repetat până când întreaga carte a fost citită cu voce tare și rescrisă Cu care dintre sistemele de procesare paralelă enumerate în subsecțiunea Paralelism la nivel de procesor din secțiunea Procesoare este cel mai asemănător acest sistem? Când treceți de sus în jos în structura ierarhică pe cinci niveluri a memoriei, timpul de acces crește Care este raportul dintre timpul de acces la un disc optic și la o memorie înregistrată? (Presupunând că un disc este deja introdus ) Atunci când efectuează un sondaj standard (de exemplu, "Credeți că zâna dinților există?"), sociologii se așteaptă să primească unul dintre cele trei răspunsuri de la respondenți: "da", "nu" sau "nu pot spune orice despre asta" Să presupunem că având în vedere acest lucru, Socimagnetic Computer decide să construiască un computer pentru a procesa datele sondajului Acest computer implementează memoria ternară; cu alte cuvinte, fiecare octet (mai precis, "trite") este format din trits, iar fiecare trit poate lua valoarea , sau De câte trituri aveți nevoie pentru a stoca un număr de biți? Scrieți o formulă pentru a calcula numărul de triți necesari pentru a stoca n biți Calculați rata de date în ochiul uman utilizând următoarele informații Câmpul vizual este format din aproximativ elemente (pixeli) Fiecare pixel poate fi format prin suprapunerea a trei culori primare, fiecare având de grade de intensitate Rezoluția în timp este de de milisecunde Calculați rata de date în urechea umană din următoarele date O persoană aude sunete la frecvențe de până la kHz Pentru a determina toate informațiile conținute într-un semnal audio de kHz, trebuie să luați "eșantionul" acestuia la o frecvență dublă - kHz O mostră de biți este suficientă pentru a capta toate datele auditive (deoarece nu mai mult de de niveluri de intensitate a sunetului sunt disponibile pentru ureche) I Informaţia genetică la toate fiinţele vii este codificată în moleculele de ADN Molecula de ADN este o secvență liniară de patru Capitolul Organizarea sistemelor informatice nucleotide de bază: A, C, G și T Genomul uman conține aproximativ x IO nucleotide sub formă de de gene Care este capacitatea totală de informare a genomului uman (în biți)? Care este capacitatea medie de informare a unei gene (în biți)? Un computer poate stoca de octeți de memorie De ce au ales dezvoltatorii un astfel de număr impar în loc de ceva memorabil precum ? Veniți cu un cod Hamming de biți cu biți de paritate pentru biții de la la Vino cu un cod pentru cifrele de la la cu un interval Hamming de În codul Hamming, unii biți sunt "gol" în sensul că sunt folosiți pentru verificare și nu poartă nicio informație Ce procent de biți goli sunt conținute în mesajele a căror lungime totală (date plus biți de verificare) este n - ? Calculați valoarea acestei expresii pentru n de la la Discul prezentat în fig are de sectoare pe pistă și o viteză de rotație de rpm Care este rata de date pe o singură pistă? Calculatorul conține o magistrală cu un timp de interogare de ns Într-un ciclu de interogare, poate citi din memorie sau scrie în memorie un cuvânt de de biți Computerul are o unitate Ultra -SCSI care folosește o magistrală și transferă informații la MB/s CPU apelează de obicei din memorie și execută o instrucțiune pe de biți la fiecare ns Cât de mult încetinește un disc un procesor? Imaginați-vă că scrieți software pentru partea sistemului de operare care este responsabilă de gestionarea discurilor În mod logic, te gândești la un disc ca la o secvență de blocuri de la în interior până la un maxim în exterior Când fișierele sunt create, trebuie să alocați memorie în sectoare libere Vă puteți deplasa de la marginea exterioară spre interior sau invers Contează ce strategie să alegi? Explică-ți răspunsul Cât durează să citești un disc cu de cilindri, fiecare conținând piste de de sectoare? În primul rând, sunt citite toate sectoarele piesei , începând de la sectorul , apoi toate sectoarele piesei , începând de la sectorul și așa mai departe, părți ale discului - până la ms Trecerea de la o cale a cilindrului la alta este instantanee Nivelul RAID poate corecta erorile pe un singur bit folosind un singur disc de paritate Ce se întâmplă într-o matrice RAID de nivel ? La urma urmei, poate corecta și erori individuale, dar folosește mai multe discuri Întrebări și sarcini Care este capacitatea exactă (în octeți) a unui CD-ROM de tip care conține de minute de date (capacitate personalizată)? Care este capacitatea datelor utilizatorului de pe un disc de tip ? Pentru a inscripționa un disc CD-R, laserul trebuie să se pornească și să se oprească foarte repede Care este durata pulsului (pornit și oprit) în nanosecunde dacă un CD de tip este înregistrat la x? Pentru a încadra un film de de minute pe un DVD cu un singur strat este nevoie de puțină compresie Calculați cât aveți nevoie pentru a comprima filmul Se presupune că o pistă de imagine are nevoie de , GB pentru a fi înregistrată, rezoluția imaginii este de x pixeli cu culoare pe de biți și se schimbă de cadre pe secundă Datele de pe discuri Blu-ray de GB sunt citite la , Mbps Cât durează să citești toate datele de pe un astfel de disc? Rata de transfer de date între unitatea centrală de procesare și memoria asociată acesteia este cu câteva ordine de mărime mai mare decât rata de transfer de date de la dispozitivele I/O mecanice Cum ar putea această nepotrivire să provoace degradarea performanței? Cum poate fi atenuată această degradare a performanței? Producătorul spune că terminalul său grafic color poate afișa de culori diferite Cu toate acestea, hardware-ul are doar octet pentru fiecare pixel Cum obții atâtea culori? Terminalul grafic are un monitor de x pixeli Imaginea de pe monitor se schimbă de de ori pe secundă Cât de des se schimbă un pixel individual? O imprimantă laser monocromă poate imprima de linii de de caractere într-un anumit font pe o coală Un caracter ocupă un spațiu mediu de x mm, tonerul ocupând % din acest spațiu, iar restul rămânând alb Stratul de toner are o grosime de de microni Cartușul de toner măsoară x x cm Câte pagini va dura cartuşul? Când textul ASCII verificat de paritate este transmis asincron la de caractere/s printr-un modem care transmite informații la bps, ce procent din biții primiți conține date (adică nu conțin supraîncărcare)? O companie de modem a dezvoltat un nou modem FM care folosește de frecvențe în loc de Fiecare secundă este împărțită în n intervale de timp egale, fiecare conținând unul dintre cele de tonuri posibile Câți biți pe secundă poate transmite acest modem în cazul transmisiei sincrone? Să presupunem că un anumit utilizator este conectat la ADSL cu o rată de transfer de date de Mbps, iar vecinul său este conectat la o linie de Internet prin cablu cu o lățime de bandă totală de MHz Schema de modulație este QAM- Există n case conectate la cablu, câte un computer în fiecare O parte (/) a acestor computere în orice moment dat Capitolul Organizarea sistemelor informatice deconectat de la rețea În ce condiții viteza de transmitere a datelor prin cablu va depăși viteza de acces la Internet printr-o linie ADSL? Într-o cameră digitală cu o rezoluție de x pixeli, octeți sunt alocați pe pixel pentru transmiterea culorilor modelului RGB Producătorul camerei dorește ca o imagine JPEG cu un raport de compresie de x să fie scrisă pe un card de memorie flash în secunde Cu ce viteză de date poate fi îndeplinită această cerință? O cameră profesională are un imager de milioane de pixeli și octeți sunt alocați pentru transmiterea culorii în fiecare dintre pixeli Câte imagini pot fi stocate pe un card de memorie flash de GB cu un raport de compresie de x? Să presupunem, pentru simplitatea calculelor, că GB este egal cu de octeți Estimați câte caractere (inclusiv spații) conține o carte tipică de informatică Câți biți sunt necesari pentru a codifica o carte în cod ASCII cu paritate uniformă? De câte CD-uri aveți nevoie pentru a stoca de cărți de informatică? De câte DVD-uri față-verso, cu două straturi aveți nevoie pentru a stoca același număr de cărți? Scrieți o procedură hamming(ascii, codificat) care convertește biți ascii consecutivi într-un întreg codificat AND-bit Scrieți o funcție distanță (cod, n, k) care ia ca intrare un cod matrice de n caractere, k biți fiecare, și returnează abaterea statistică a caracterelor capitolul Nivel logic digital În partea de jos a diagramei ierarhice din Fig este nivelul logic digital sau hardware-ul computerului În acest capitol, ne vom uita la diferite aspecte ale logicii digitale, care ar trebui să formeze baza studiului nivelurilor superioare în capitolele următoare Subiectul de studiu se află la granița informaticii și ingineriei electrice, dar materialul este autosuficient, așa că nu este necesară cunoașterea prealabilă cu hardware și inginerie electrică Elementele de bază din care sunt construite calculatoarele digitale sunt extrem de simple Ne vom uita mai întâi la aceste elemente de bază, precum și la algebra specială cu două valori (algebra booleană) care este utilizată în construirea acestor elemente Apoi vom studia circuitele de bază care pot fi construite din porți în diverse combinații, inclusiv circuite pentru efectuarea de operații aritmetice Următorul subiect este despre cum să combinați porțile pentru a stoca informații, adică cum să construiți o memorie După aceea, vom trece la procesoare și la modul în care procesoarele de pe un singur cip comunică cu memoria și perifericele Ne uităm apoi la diverse exemple luate din industria calculatoarelor Gates și algebra booleană Circuitele digitale pot fi construite dintr-un număr mic de elemente simple prin combinarea acestor elemente în diferite combinații Următoarele subsecțiuni descriu aceste elemente de bază, arată cum pot fi combinate și introduc o metodă matematică pentru analizarea modului în care funcționează supape Un circuit digital este un circuit care are doar două valori booleene De obicei, un semnal de la la V reprezintă o valoare (de exemplu, ), iar un semnal de la la V reprezintă o altă valoare (de exemplu, ) Tensiunea în afara valorilor specificate nu este permisă Dispozitivele electronice minuscule numite porți permit ca din aceste semnale din două cifre să fie derivate diferite funcții Porțile sunt în centrul hardware-ului pe care sunt construite toate computerele digitale Descrierea modului în care funcționează porțile nu intră în domeniul de aplicare al acestei cărți, deoarece se referă la nivelul dispozitivului fizic, care este sub nivelul Cu toate acestea, vom atinge foarte pe scurt principiul de bază conform căruia Capitolul Nivel logic digital nu atât de complicat Toată logica digitală modernă se bazează pe faptul că un tranzistor poate acționa ca un comutator binar foarte rapid Pe fig a prezintă un tranzistor bipolar construit într-un circuit simplu Tranzistorul are trei conexiuni cu lumea exterioară: colector, bază și emițător Dacă tensiunea de intrare Vip este sub o anumită valoare critică, tranzistorul se oprește și acționează ca o rezistență foarte mare Aceasta are ca rezultat un semnal de ieșire Vout aproape de Vcc (tensiune furnizată extern) •- pentru acest tip de tranzistor acesta este de obicei + V este O B) Orez Invertor cu tranzistori (a); poarta NU ȘI (b); NU SAU poarta (c) Este important de reținut că dacă Vip este scăzut, atunci Vout este ridicat și invers Acest circuit este astfel un invertor care transformă logic în logic și logic în logic Rezistorul (linia întreruptă) este necesar pentru a limita curentul prin tranzistor, astfel încât tranzistorul să nu se ardă Trecerea de la o stare la alta durează de obicei câteva nanosecunde Pe fig , b două tranzistoare sunt conectate în serie Dacă atât Vlf, cât și V sunt mari, ambele tranzistoare devin conductori și reduc Vout Dacă una dintre tensiunile de intrare este scăzută, atunci tranzistorul corespunzător se oprește și tensiunea de ieșire devine ridicată Cu alte cuvinte, Vout este scăzut dacă și numai dacă atât V , cât și V sunt mari Pe fig , două tranzistoare sunt conectate în paralel Dacă una dintre intrări este ridicată, tranzistorul corespunzător pornește și reduce ieșirea Dacă ambele tensiuni de intrare sunt scăzute, atunci tensiunea de ieșire devine ridicată Aceste trei circuite formează trei porți simple Ele sunt numite porți NOT, NAND și, respectiv, NOR Porțile NU sunt adesea denumite inversate Gates și algebra booleană ramie Vom folosi ambii termeni Dacă acceptăm convenția conform căreia tensiunea înaltă (Vcc) este un logic și tensiunea joasă (masă) este un logic, atunci putem exprima valoarea de ieșire în funcție de valorile de intrare Pictogramele care sunt folosite pentru a descrie aceste trei tipuri de supape sunt prezentate în fig , a-c Acolo sunt prezentate și modurile de funcționare ale funcției pentru fiecare schemă În aceste figuri, A și B sunt semnale de intrare, X este semnalul de ieșire Fiecare rând de tabel definește un semnal de ieșire pentru diferite combinații de semnale de intrare A X Orez Pictograme pentru reprezentarea celor cinci supape principale Moduri de funcționare pentru fiecare supapă Dacă semnalul de ieșire din Fig , b alimentează invertorul, obținem un alt circuit opus porții NAND, adică unul în care semnalul de ieșire este dacă și numai dacă ambele semnale de intrare sunt Un astfel de circuit se numește poartă AND; imaginea acestuia și descrierea funcției corespunzătoare sunt date în fig , d În mod similar, o poartă NOR poate fi conectată la un invertor Apoi obținem un circuit în care semnalul de ieșire este egal cu dacă cel puțin unul dintre semnalele de intrare este unitate și este egal cu dacă ambele semnale de intrare sunt zero O imagine a acestui circuit, care se numește o poartă SAU, precum și o descriere a funcției corespunzătoare, sunt date în fig , e Cercurile mici din circuitele invertorului, porții NAND și porții NOR sunt numite ieșiri inversoare Ele pot fi folosite și în alte contexte pentru a indica un semnal inversat Cele cinci supape prezentate în fig formează baza nivelului logic digital Ar trebui să fie clar din discuția de mai sus că porțile NAND și NOR necesită câte doi tranzistori fiecare, iar porțile AND și OR necesită câte trei tranzistoare Din acest motiv, multe computere folosesc porți NAND și NOR mai degrabă decât porți AND și OR (În practică, toate porțile sunt construite oarecum diferit, dar porțile NAND și NOR sunt oricum mai simple decât AND și SAU ) Trebuie menționat că porțile pot avea mai mult de două intrări În principiu, o poartă NAND, de exemplu, poate avea un număr arbitrar de intrări, dar în practică, de obicei, nu există mai mult de opt Deși proiectarea supapelor este la nivelul dispozitivelor fizice, vom menționa în continuare principalele linii de tehnologii de fabricație, deoarece acestea sunt adesea Capitolul Nivel logic digital sunt menționate în literatură Cele două tehnologii principale sunt bipolare și MOS (metal, oxid, semiconductor) Tehnologiile bipolare includ TTL (Tranzistor-Tranzistor Logic), care a fost coloana vertebrală a electronicii digitale de mulți ani, și ECL (Emitter-Coupled Logic), care este utilizat atunci când sunt necesare operațiuni de mare viteză În ceea ce privește circuitele de calcul, tehnologia MOS este mai comună Supapele MOS sunt mai lente decât TTL și ECL, dar consumă mult mai puțină energie și ocupă mult mai puțin spațiu, astfel încât un număr mare de astfel de supape pot fi aranjate compact Supapele MOS sunt disponibile în mai multe varietăți: MOS cu canal p, MOS cu canal n și MOS complementar Deși MOSFET-urile sunt proiectate diferit de tranzistoarele bipolare, ele pot funcționa și ca comutatoare electronice Procesoarele și memoria moderne sunt cel mai adesea fabricate folosind tehnologia MOS complementară, care funcționează la + , V Atât putem spune despre nivelul dispozitivului fizic Cititorii care doresc să afle mai multe despre acest nivel se pot referi la literatura citată în capitolul algebră booleană Pentru a descrie circuite obținute prin combinarea diferitelor porți, avem nevoie de un tip special de algebră în care toate variabilele și funcțiile pot lua doar două valori: și O astfel de algebră se numește booleană Este numit după matematicianul englez George Boole ( - ) De fapt, în acest caz, vorbim despre un tip special de algebră booleană, și anume algebra circuitelor releu, dar termenul de "algebră booleană" este foarte des folosit în sensul de "algebră a circuitelor relee", așa că vom nu face distincție între ele La fel ca algebra obișnuită (adică cea care se studiază la școală), algebra booleană are propriile sale funcții O funcție booleană ia una sau mai multe variabile ca intrare și produce un rezultat care depinde numai de valorile acelor variabile Se poate defini o funcție simplă / spunând că f(A) = dacă A = și f(A) = dacă A = O astfel de funcție ar fi o funcție NOT (vezi Figura a) Deoarece o funcție booleană de n variabile are doar " combinații posibile de valori variabile, o astfel de funcție poate fi descrisă complet într-un tabel cu rânduri de " Fiecare linie va da valoarea funcției pentru diferite combinații de valori variabile Un astfel de tabel se numește tabel de adevăr Toate tabelele din fig sunt tabele de adevăr Dacă suntem de acord să aranjam întotdeauna rândurile tabelului de adevăr în ordine numerică, adică pentru două variabile în ordinea , , , AND, atunci funcția poate fi complet descrisă printr-un număr binar de "biți, care este obţinute prin citirea coloanei rezultat din tabelul pe verticală adevăr Astfel, NAND este , NOR este , AND este și OR este Evident, există doar funcții booleene a două variabile, care corespund la șiruri posibile de biți În algebra obișnuită, dimpotrivă, există un număr infinit de funcții a două variabile și niciuna dintre ele Gates și algebra booleană nu poate fi descris dând un tabel cu valorile acestei funcții pentru toate valorile posibile ale variabilelor de intrare, deoarece fiecare variabilă poate lua un număr infinit de valori Pe fig , a arată tabelul de adevăr pentru o funcție booleană a trei variabile: M = / (L, B, C) Aceasta este o funcție majoritară care ia valoarea dacă majoritatea variabilelor sunt , sau dacă majoritatea variabilelor sunt Deși orice funcție booleană poate fi definită folosind un tabel de adevăr, acest tip de notație devine greu de utilizat pe măsură ce numărul de variabilele cresc Prin urmare, în loc de tabele de adevăr, este adesea folosită o altă notație A în cu m Orez Tabelul de adevăr pentru funcția majoritară a trei variabile (a); schema de implementare a acestei funcții (b) Pentru a vedea acest alt tip de notație, rețineți că orice funcție booleană poate fi definită prin specificarea combinațiilor de valori ale variabilelor de intrare care au ca rezultat o valoare unitară a funcției Pentru funcția prezentată în fig , a, există combinații de variabile care dau o singură valoare a funcției Vom desena o bară peste variabilă pentru a indica faptul că valoarea acesteia este inversată Absența unei liniuțe înseamnă că valoarea variabilei Capitolul Nivel logic digital nu este inversată În plus, vom folosi semnul de înmulțire (punct) pentru a reprezenta funcția booleană AND (acest semn poate fi omis) și semnul de adunare (+) pentru a reprezenta funcția booleană SAU De exemplu, ABC este numai dacă L = , B = și C= De asemenea, AB + BC este numai dacă (A = și B = ) sau (B = și C = ) În tabelul din fig , iar funcția ia valoarea în patru linii: ABC, ABC, ABC și ABC Funcția M se evaluează la adevărat (adică ) dacă una dintre aceste patru condiții este adevărată Prin urmare, putem scrie M = ABC + ABC + ABC + ABC Aceasta este o notație compactă a tabelului de adevăr Astfel, o funcție a n variabile poate fi descrisă prin suma a cel mult n produse, fiecare produs având n factori După cum vom vedea în scurt timp, această formulare este deosebit de importantă deoarece permite implementarea acestei funcții folosind porți standard Este important să înțelegem diferența dintre o funcție booleană abstractă și implementarea ei cu un circuit electronic O funcție booleană constă din variabile, cum ar fi A, B și C, precum și operatori AND, OR și NOT O funcție booleană este descrisă folosind un tabel de adevăr sau o notație specială, de exemplu: F = ABC + ABC O funcție booleană poate fi implementată de un circuit electronic (adesea în diferite moduri) folosind semnale care reprezintă variabile de intrare și ieșire și porți precum AND, OR și NOT Implementarea funcţiilor booleene După cum sa menționat mai devreme, reprezentarea unei funcții booleene ca o sumă de produse de cel mult " face posibilă implementarea acestei funcții Pe fig , b, semnalele de intrare A, B și C sunt afișate în partea stângă, iar funcția M obținută la ieșire este afișată în dreapta Deoarece sunt necesare valori suplimentare (inversări) ale variabilelor de intrare, semnalul trece prin invertoarele , și pentru a le obține Pentru a face figura mai clară, am trasat linii verticale, dintre care sunt asociate cu intrarea variabile, altele - cu inversiunile lor Aceste linii transportă semnalul de intrare către supape De exemplu, porțile , și primesc un semnal A la intrarea lor Într-un circuit real, aceste porți ar fi probabil conectate direct la A fără fire verticale între ele Circuitul conține patru porți AND, câte una pentru fiecare termen din ecuația pentru M (adică câte una pentru fiecare rând din tabelul de adevăr cu un rezultat de ) Fiecare poartă AND evaluează unul dintre rândurile specificate ale tabelului de adevăr În final, toate aceste produse sunt însumate (adică operația SAU) pentru a obține rezultatul final Uită-te la fig b În această carte, vom folosi următoarea convenție: dacă două linii dintr-un desen se intersectează, relația este implicită Gates și algebra booleană numai dacă există un punct aldine la intersecție De exemplu, ieșirea porții intersectează toate cele linii verticale, dar este conectată doar la linia C Rețineți că alți autori pot folosi convenții diferite Din fig ar trebui să fie clar cum să obțineți schema pentru orice funcție booleană: Faceți un tabel de adevăr pentru această funcție Includeți invertoare în circuit pentru a putea inversa fiecare semnal de intrare Desenați o poartă AND pentru fiecare rând al tabelului de adevăr cu rezultatul Conectați porțile AND la semnalele de intrare corespunzătoare Ieșiți ieșirile tuturor porților AND și direcționați-le către intrarea porții SAU Am arătat cum să implementăm orice funcție booleană folosind porțile NOT, AND și OR Cu toate acestea, este mult mai convenabil să construiți circuite folosind un singur tip de poartă Din fericire, este ușor să convertiți circuitele construite conform algoritmului anterior într-o formă NAND sau NOR Pentru a implementa această transformare, tot ce trebuie să facem este să implementăm porțile NOT, AND și OR cu un singur tip de poartă Figura arată cum se face acest lucru cu o poartă NAND sau NOR Rețineți că există și alte opțiuni pentru o astfel de transformare Orez Construcția porților NOT (a), AND (b) și OR (c) numai pe baza unei porți NAND sau NOR Capitolul Nivel logic digital Pentru a implementa o funcție booleană bazată doar pe o poartă NAND sau NOR, puteți urma mai întâi algoritmul descris prin construirea unui circuit cu porți NOT, AND și OR Apoi, trebuie să înlocuiți supapele cu mai multe porturi cu circuite echivalente pe ventile cu două porturi De exemplu, A + B + C + D poate fi schimbat în (A + B) + (C + D) utilizând trei porți cu două sensuri Apoi porțile NOT, AND și OR sunt înlocuite cu circuitele prezentate în fig Deși această procedură nu conduce la circuite optime în ceea ce privește numărul minim de porți, ea demonstrează că o astfel de transformare este fezabilă Porțile NAND și NOR sunt considerate complete deoarece fiecare dintre ele vă permite să evaluați orice funcție booleană Nicio altă poartă nu are această proprietate, motiv pentru care aceste două tipuri de porți sunt preferate la construirea circuitelor Echivalența schemei Proiectanții de circuite încearcă adesea să reducă numărul de porți pentru a reduce prețul, a reduce spațiul ocupat de circuit, a reduce consumul de energie etc Pentru a simplifica circuitul, proiectantul trebuie să găsească un alt circuit care să poată calcula aceeași funcție, dar necesită mai puține porți (sau pot funcționa cu supape mai simple, cum ar fi supape cu căi în loc de supape cu căi) Algebra booleană este un instrument valoros în găsirea circuitelor echivalente Ca exemplu de utilizare al algebrei booleene, luați în considerare circuitul și tabelul de adevăr pentru funcția AB + AC (Fig , a) Deși nu am discutat încă, multe dintre regulile algebrei obișnuite se aplică și algebrei booleene De exemplu, expresia AB + AC conform legii distribuției poate fi transformată în A (B + Figura , b prezintă circuitul și tabelul de adevăr pentru funcția A (B + Două funcții sunt echivalente dacă și numai dacă ambele funcții iau aceeași valoare pentru toate variabilele posibile Din tabelele de adevăr din Fig este clar că funcția A(B + este echivalentă cu funcția AB + AC În ciuda acestei echivalențe, circuitul din Fig b este mai simplu decât circuitul din Fig , a, deoarece conține mai puține porți De obicei, un dezvoltator începe de la o anumită funcție booleană și apoi îi aplică legile algebrei booleene pentru a găsi o funcție mai simplă care să fie echivalentă cu cea originală Pe baza funcției rezultate, puteți proiecta un circuit Pentru a utiliza această abordare, trebuie să cunoașteți câteva relații (legi) ale algebrei booleene, care sunt prezentate în tabel Este interesant de observat că fiecare raport are două forme O formă poate fi obținută dintr-o alta prin schimbarea AND la SAU și la Toate relațiile pot fi dovedite cu ușurință prin compilarea tabelelor de adevăr pentru ele În aproape toate cazurile, rezultatele sunt clare, cu excepția relației De Morgan, a relației de absorbție și a relației de distribuție Relația De Morgan poate fi extinsă la expresii cu mai mult de două variabile, cum ar fi ABC = A + B + C Gates și algebra booleană Orez Două funcții echivalente: AB + AC (a); A(B + C) (b) A în c A în + c A (B + C) b Tabelul - - Câteva relații ale algebrei booleene Raport ȘI SAU Relația de identitate A \u d A + A \u d A Raportul zero OD = + A = Relația de idepotență DA =A A+A=A Raportul de inversiune AĂ = A+Ă= Relația de comutativitate AB = BA A + B = B + A Raport asociativ (AB)C \u d A (BC) (A + B) + C ~ A + (B + C) Relația de distribuție A + BC = (A + B)(A + C) A(B + C) = AB + AC Raportul de absorbție A(A + B) = A A + AB = A Raportul lui De Morgan ĂB = Ă~+B Ă + ~B=ĂB Raportul lui De Morgan sugerează o notație alternativă Pe fig , iar forma AND este dată cu negație, care este prezentată folosind intrări și ieșiri inversate Astfel, o poartă SAU cu intrări inversate este echivalentă cu o poartă NAND Din fig b, care ilustrează a doua formă a relației De Morgan, este clar că în loc de o poartă NOR, se poate desena o poartă AND cu intrări inversate Prin negarea ambelor forme ale relației De Morgan, ajungem la reprezentări echivalente ale porților AND și OR (Fig , c și d) Simbol similar Capitolul Nivel logic digital Imaginile există pentru diferite forme ale relației De Morgan (de exemplu, o poartă NAND cu n intrări devine o poartă SAU cu intrări inversate) Orez Reprezentări alternative ale unor porți: NAND (a); NU-SAU (b); Si in); SAU (g) Folosind ecuațiile prezentate în fig și ecuații similare pentru porțile cu mai multe intrări, se poate converti cu ușurință suma produselor în forma numai de porți NAND sau numai de porți NOR Ca exemplu, luați în considerare funcția SAU EXCLUSIV (Fig , a) Schema standard care exprimă suma produselor este prezentată în fig b Pentru a merge la formularul NAND, trebuie să desenați linii care conectează ieșirile porților AND cu intrarea porții SAU cu intrări și ieșiri inversoare, așa cum se arată în Fig , c Orez Tabel de adevăr pentru funcția SAU EXCLUSIV (a) Trei scheme pentru calcularea acestei funcții (b), (c), (d) Circuite logice digitale de bază Apoi, pe baza fig , a, ajungem la fig , d Variabilele A și B pot fi obținute din L și B folosind porți NAND sau NOR cu intrări combinate Rețineți că intrările (ieșirile) inversoare pot fi mutate de-a lungul liniei de comunicație după bunul plac, de exemplu, de la ieșirile porților de intrare la intrările porții de ieșire Este foarte important de reținut că aceeași poartă poate calcula diferite funcții în funcție de convențiile utilizate Pe fig și am arătat semnalele de ieșire ale porții F pentru diferite combinații de semnale de intrare Atât semnalele de intrare, cât și de ieșire sunt date în volți Dacă acceptăm convenția conform căreia V este un zero logic și , V sau V este unul logic, obținem tabelul de adevăr prezentat în Fig , b, adică funcția And Un astfel de acord se numește logică pozitivă Cu toate acestea, dacă acceptăm logica negativă, adică suntem de acord că OB este o unitate logică, iar , V sau V este un zero logic, atunci vom obține tabelul de adevăr prezentat în Fig , în, adică funcția SAU A B F OV OV OV ov V OV V OV ov V V V A A B F b A la F V Orez Caracteristicile electrice ale dispozitivului (a); logica pozitiva (b); logica negativa (c) Astfel, totul depinde de ce convenție este aleasă pentru afișarea tensiunilor în mărimi logice În această carte, ne vom limita mai ales la logica pozitivă Cazurile de utilizare a logicii negative vor fi discutate separat Circuite logice digitale de bază Acum știm cum să construim cele mai simple circuite din porți individuale În practică, circuitele logice digitale sunt foarte rar construite poartă cu poartă, deși această abordare a fost cândva obișnuită Acum, blocurile standard de "construcții" sunt module care combină mai multe supape În următoarele subsecțiuni, vom analiza aceste blocuri de construcție mai detaliat și vom vedea cum sunt utilizate și cum să le obținem de la porțile individuale circuite integrate Supapele nu sunt fabricate și vândute individual, ci în module numite circuite integrate (CI) sau microcircuite circuit integrat Capitolul Nivel logic digital ma este o bucată pătrată de silicon cu dimensiunea de aproximativ x mm, pe care sunt amplasate mai multe porți Circuitele integrate mici sunt de obicei găzduite în pachete dreptunghiulare din plastic sau ceramică cu lățime de până la mm și lungime de până la mm De-a lungul laturilor lungi sunt două rânduri paralele de cabluri de aproximativ mm lungime care pot fi conectate la conectori sau lipite pe un PCB Fiecare pin este conectat la intrarea sau ieșirea unei porți, la o sursă de alimentare sau la masă Un pachet cu două rânduri de pini la exterior și circuite integrate în interior se numește oficial pachet Dual Inline Package (DIP), dar toată lumea îl numește IC, ignorând diferența dintre o bucată de siliciu și pachetul în care este plasat Majoritatea pachetelor au , , , , , , , , sau de pini Pentru microcircuite mari, se folosesc adesea pachete, în care cablurile sunt amplasate pe toate cele patru laturi sau în partea de jos Microcircuitele pot fi împărțite în mai multe clase în ceea ce privește numărul de porți pe care le conțin Această clasificare este, desigur, foarte aspră, dar uneori poate fi utilă: + MIS (circuit integrat mic) - de la la porti; + SIS (circuit integrat mediu) - de la la de porti; + LSI (circuit integrat mare) - de la la de porti; + VLSI (circuit integrat la scară foarte mare) - peste de porți Aceste circuite au proprietăți diferite și sunt utilizate în scopuri diferite MIS conține de obicei două până la șase porți independente, fiecare dintre acestea putând fi utilizată separat, așa cum este descris în secțiunile anterioare Pe fig prezintă un MIS convențional care conține patru porți NAND Orez MIS de patru porți Circuite logice digitale de bază Fiecare dintre aceste porți are două intrări și o ieșire, necesitând pini În plus, microcircuitul necesită putere (Vcc) și masă Sunt comune tuturor supapelor De obicei, există o crestătură pe carcasă lângă pinul , astfel încât să puteți identifica că este pinul Pentru a evita confuzia în diagramă, supapele neutilizate, sursa de alimentare și împământarea nu sunt afișate prin convenție Astfel de cipuri costă câțiva cenți Fiecare conține mai multe porți și până la aproximativ de pini În anii , calculatoarele au fost construite dintr-un număr mare de astfel de microcircuite, dar în prezent, o întreagă unitate centrală de procesare și o parte semnificativă a memoriei (memoria cache) sunt plasate pe un singur microcircuit Pentru comoditate, presupunem că ieșirea porții se schimbă de îndată ce semnalul de la intrarea acesteia se schimbă De fapt, există o anumită întârziere de poartă, care include timpul de trecere a semnalului prin microcircuit și timpul de comutare Întârzierea este de obicei între și ns Acum este posibil să puneți până la milioane de tranzistori pe un singur cip Deoarece orice circuit poate fi construit din porți NAND, s-ar putea avea impresia că un producător este capabil să producă un cip care conține milioane de porți NAND Din păcate, ar fi necesari de pini pentru a crea un astfel de cip Deoarece ieșirea standard este de , inchi, cipul va avea o lungime mai mare de km, ceea ce este probabil să îi afecteze negativ capacitatea de comercializare Prin urmare, pentru a profita de această tehnologie, este necesar să se dezvolte astfel de circuite în care numărul de porți depășește semnificativ numărul de pini În următoarele subsecțiuni, vom lua în considerare MMIC-urile simple în care mai multe porți sunt interconectate într-un anumit mod pentru a calcula o anumită funcție, ceea ce face posibilă reducerea numărului de ieșiri externe Scheme combinatorii Multe aplicații ale logicii digitale necesită circuite cu mai multe intrări și mai multe ieșiri în care semnalele de ieșire sunt determinate de semnalele de intrare curente O astfel de schemă se numește combinatorie Nu toate schemele au această proprietate De exemplu, un circuit care conține elemente de memorie poate genera semnale de ieșire care depind de valorile stocate în memorie Un microcircuit care implementează un tabel de adevăr (de exemplu, prezentat în Fig , a) este un exemplu tipic de circuit combinatoriu În această secțiune, vom analiza cele mai frecvent utilizate scheme combinatorii Multiplexoarele La nivel logic digital, multiplexorul este un circuit cu intrări de ", o ieșire și n linii de control care vă permit să selectați una dintre intrări Intrarea selectată este conectată la ieșire Pe fig descris Nu uita de legea lui Moore Nucleul procesorului Pentium conține deja de milioane de tranzistori și, evident, aceasta nu este limita - Notă științific ed Capitolul Nivel logic digital circuit multiplexor cu opt intrări Cele trei linii de control, A, B și C, codifică un număr de biți care specifică care dintre cele opt linii de intrare trebuie conectată la poarta SAU și, prin urmare, la ieșire Indiferent de valoarea pe liniile de control, șapte porți AND vor scoate întotdeauna , iar cea rămasă poate scoate sau , în funcție de valoarea liniei de intrare selectate Fiecare poartă AND este declanșată de o combinație specifică de semnale pe liniile de control Dacă circuitul multiplexor prezentat în Fig , adăugați o sursă de alimentare și împământare, apoi multiplexorul poate fi inclus într-un pachet cu pini Orez RĂU Diagrama multiplexorului cu opt intrări Folosind un multiplexor, putem implementa funcția majoritară (vezi Figura a) așa cum se arată în Figura b Pentru fiecare combinație de A, B și C, se selectează una dintre liniile de intrare Fiecare intrare este conectată fie la Vcc ( logic), fie la masă ( logic) Algoritmul conexiunii de intrare este foarte simplu: intrarea D este aceeași cu valoarea din rândul i al tabelului de adevăr Pe fig , iar în liniile , , și valoarea funcției este , deci intrările corespunzătoare sunt împământate; în rândurile rămase, valoarea funcției este , deci intrările corespunzătoare sunt conectate la una logică În acest fel, orice tabel de adevăr cu trei variabile poate fi implementat folosind cipul din Fig , a Circuite logice digitale de bază Vcc Do Di D D D d D D F Do Di D D D d D D F A B C A B C A Orez Multiplexor construit pe SIS (a); același multiplexor montat pentru a calcula funcția majoritară (b) Am văzut deja cum poate fi folosit un multiplexor pentru a selecta una dintre mai multe intrări și cum permite construirea unui tabel de adevăr Poate fi folosit și ca convertor paralel cu serial Dacă aplicați biți de date liniilor de intrare și apoi comutați alternativ liniile de control pentru a obține valori de la OOO la (acestea sunt numere binare), atunci biți vor merge la linia de ieșire în serie În mod obișnuit, această conversie se realizează la introducerea informațiilor de la tastatură, deoarece fiecare apăsare de tastă determină un număr de sau biți care ar trebui transmis secvenţial prin linia telefonică Opusul unui multiplexor este un demultiplexor, care conectează un singur semnal de intrare la una dintre cele ieșiri, în funcție de valorile semnalelor din cele n linii de control Dacă valoarea binară a liniilor de control este k, atunci ieșirea k este selectată Decodoare Ca un al doilea exemplu, luați în considerare un circuit care ia un număr de n biți ca intrare și îl folosește pentru a selecta (adică, setat la ) una dintre liniile de ieșire de " Un astfel de circuit se numește decodor Un exemplu de decodor pentru n = este prezentat în fig Pentru a înțelege de ce este nevoie de un decodor, imaginați-vă o memorie formată din cipuri, fiecare conținând MB Cipul are adrese de la la MB, cipul are adrese de la MB la MB și așa mai departe Cei mai importanți trei biți ai adresei sunt utilizați pentru a selecta unul dintre cele opt cipuri Pe fig , acești trei biți sunt cei trei intrări L, B și C În funcție de semnalele de intrare, exact una dintre cele opt linii de ieșire (£) , , D ) ia valoarea G, liniile rămase iau valoarea valoarea Fiecare linie de ieșire declanșează una Capitolul Nivel logic digital de opt cipuri de memorie Deoarece o singură linie este setată la , este pornit un singur cip Orez Diagrama unui decodor care conține intrări și ieșiri Principiul de funcționare al circuitului prezentat în Fig nu este dificil Fiecare poartă AND are trei intrări, dintre care prima este A sau L, a doua este B sau B, a treia este C sau C Fiecare poartă este declanșată de o combinație diferită de intrări: Dq - combinație de A B C, Dx - combinație de A B C și t d Comparatoare Un alt circuit util este comparatorul Comparatorul compară două cuvinte care sunt introduse Comparatorul prezentat în fig ia două intrări, L și B, câte biți fiecare, și iese dacă sunt egale și dacă nu sunt egale Circuitul se bazează pe o poartă EXCLUSIVĂ SAU care scoate dacă intrările sunt egale și dacă intrările nu sunt egale Dacă toate cele patru cuvinte de intrare sunt egale, toate cele patru porți SAU EXCLUSIVE ar trebui să iasă Aceste patru semnale sunt apoi introduse în poarta SAU Dacă rezultatul este , atunci cuvintele de intrare sunt egale; altfel nu sunt egali În exemplul nostru, am folosit o poartă OR ca finală pentru a schimba valoarea rezultatului: înseamnă egal, înseamnă inegalitate Circuite logice digitale de bază Orez Comparator simplu pe biți Matrici logice programabile Sa observat mai devreme că orice funcție (tabelul de adevăr) poate fi reprezentată ca o sumă de produse și, prin urmare, întruchipată într-un circuit folosind porți AND și SAU Așa-numita matrice logică programabilă este utilizată pentru a calcula sumele produselor (Fig ) Acest cip conține intrări pentru variabile Semnale suplimentare (inversări) sunt generate în interiorul microcircuitului însuși Rezultatul este un total de de semnale de intrare Ce semnal de intrare intră într-o anumită poartă AND este determinat de o matrice de x de biți Fiecare dintre liniile de intrare către porțile AND conține o legătură sigură La ieșirea din fabrică, toate cele de jumperi rămân intacte Pentru a programa matricea, clientul arde jumperii selectați prin aplicarea unei tensiuni ridicate la circuit Partea de ieșire a circuitului constă din șase porți SAU, fiecare conținând până la de intrări, ceea ce corespunde prezenței a de ieșiri pentru porțile AND Care dintre conexiunile potențiale există de fapt depinde de modul în care a fost programată matricea de x Microcircuitul are pini de intrare, pini de ieșire, putere și masă (adică de pini în total) Să dăm un exemplu de utilizare a unei matrice logică programabilă Să revenim la diagrama din fig b Conține trei intrări, patru porți AND, o poartă SAU și trei invertoare Dacă ne programăm matricea într-un anumit mod, aceasta poate calcula aceeași funcție folosind trei dintre cele intrări, patru dintre cele de porți AND și una dintre porțile SAU (Cele patru porți AND trebuie să calculeze produsele ABC, ABC, ABC și ABC; poarta SAU preia aceste produse ca intrare ) Puteți avea aceeași matrice logică programabilă să calculeze suma în același timp Capitolul Nivel logic digital patru funcții de aceeași complexitate Pentru funcțiile simple, factorul limitativ este numărul de variabile de intrare, pentru cele mai complexe, porțile AND și SAU Dacă acest jumper se arde, atunci semnalul de la supapa nu ajunge la supapa ieșiri Orez Matrice logica programabila cu intrari si iesiri Pătratele mici sunt legături fuzibile care sunt arse pentru a obține funcția dorită Siguranțele sunt ordonate în două matrice, matricea superioară este pentru porțile AND, cea inferioară este pentru porțile SAU Deși matricele programabile în câmp sunt încă utilizate, sunt preferate matricele personalizate Sunt dezvoltate de client și produse de producător în conformitate cu cerințele clientului Astfel de matrice logice programabile sunt mult mai ieftine Circuite logice digitale de bază Acum putem discuta trei moduri diferite de a implementa tabelul de adevăr prezentat în Fig , a Dacă folosim ca componente MIS, avem nevoie de microcircuite Pe de altă parte, ne putem descurca cu un singur multiplexor bazat pe SIS, așa cum se arată în Fig b În cele din urmă, putem folosi doar un sfert din matricea logică programabilă Evident, dacă trebuie calculate multe funcții, utilizarea unei matrice logică programabilă este mai eficientă decât utilizarea celorlalte două metode Pentru circuite simple, sunt de preferat MIS și SIS mai ieftine Scheme aritmetice Să trecem de la SIS de uz general la scheme SIS combinatorii care sunt utilizate pentru a efectua operații aritmetice Vom începe cu un simplu shifter de biți, apoi ne uităm la structura sumătorilor și, în final, vom privi unitățile logice aritmetice, care joacă un rol esențial în orice computer Scheme de forfecare Primul circuit aritmetic al SIS, pe care îl vom lua în considerare, va fi un circuit cu deplasare care conține intrări și ieșiri (Fig ) Opt biți de intrare sunt introduși în liniile Do,Dy Datele de ieșire, care sunt datele de intrare deplasate cu bit, sunt primite pe linia , Sy Linia de control C determină direcția de schimbare: - la stânga, - la dreapta Orez Schema de schimburi Pentru a înțelege cum funcționează un astfel de circuit, luați în considerare perechile de porți AND (cu excepția celor extreme) Dacă C = , membrul drept al fiecărei perechi este pornit, trecând bitul corespunzător prin el însuși Deoarece poarta dreaptă AND este conectată la intrare Capitolul Nivel logic digital poarta SAU, care este situată în dreapta acestei porți ȘI, este deplasată la dreapta Dacă C \u d , poarta ȘI stânga a perechii este activată, apoi are loc o deplasare la stânga Aditivi Un computer care nu poate adăuga numere întregi este practic de neconceput Prin urmare, circuitul pentru efectuarea operațiilor de adăugare este o parte esențială a oricărui procesor Tabelul de adevăr pentru adăugarea numerelor întregi cu o singură cifră este prezentat în fig , a Există două rezultate aici: suma variabilelor de intrare L și B și un transfer la următoarea poziție (stânga) Circuitul de calcul al bitului de sumă și al bitului de transport este prezentat în fig b Un astfel de circuit este de obicei numit semi-adunator A B Transfer de sumă Exclusiv-sau poarta Transfer Orez Tabel de adevăr pentru adăugarea numerelor dintr-o singură cifră (a); jumatate de circuit sumator ( ) Jumătatea de adunare este potrivită pentru adăugarea biților inferiori ai două cuvinte cu mai mulți biți Cu toate acestea, nu este potrivit pentru adăugarea de biți în mijlocul unui cuvânt, deoarece nu poate fi transportat în acea poziție Prin urmare, este necesar un adunator complet (Fig ) Ar trebui să fie clar din diagramă că un sumator complet este format din două jumătăți de sumatori Suma este dacă există un număr impar de variabile A, B și intrarea de transfer este (adică dacă una dintre variabile sau toate trei este egală cu una) Ieșirea de transport este dacă fie A și B sunt ambele (intrarea din stânga la poarta SAU) sau unul dintre ei este și intrarea de transport este, de asemenea, Cele două jumătăți de adunare produc atât biți de sumă, cât și biți de transport Pentru a construi un sumator, de exemplu, pentru două cuvinte de biți, trebuie să duplicați circuitul prezentat în Fig ori b Transferul se face către bitul adiacent stâng Un transfer la bitul din dreapta este conectat la Un astfel de sumator se numește un sumător de transfer Adăugarea de la la nu va avea loc până când transportul nu va trece de la bitul din dreapta la cel din stânga Există agregatoare mai rapide care funcționează fără această întârziere Desigur, li se acordă preferință Circuite logice digitale de bază A in Transfer In Sum Transfer Out Intrare transfer a b Orez Tabelul de adevăr pentru sumatorul complet (a); circuit pentru un sumator complet (b) Luați în considerare un exemplu de adăugare mai rapidă Să împărțim sumatorul pe de biți în jumătăți: cel de jos pe biți și cel de sus pe biți Când începe adăugarea, sumatorul superior nu poate începe încă să funcționeze, deoarece nu cunoaște valoarea transportului și nu va putea afla până când nu se fac însumări în sumatorul inferior Cu toate acestea, se poate face o singură transformare În loc de un vizor superior, puteți obține două sumătoare superioare prin duplicarea părții corespunzătoare a echipamentului Apoi circuitul va fi format din trei sumatoare pe biți: unul inferior și două superioare, Uo și Ulf lucrând în paralel Ca transport, intră în sumatorul Uo, iar intră în sumator Ambele sumatoare superioare încep să lucreze simultan cu sumatorul inferior, dar numai unul dintre rezultatele însumării celor doi sumatori superioare va fi corect După adăugarea celor cifre inferioare, valoarea transferului către suma superioară devine cunoscută, iar apoi poate fi determinat răspunsul corect Cu această abordare, timpul de adăugare se reduce la jumătate Un astfel de adunator este numit un adunator carry-select Puteți împărți din nou fiecare sumator pe biți în două sumătoare pe biți și așa mai departe Unități aritmetice logice Majoritatea calculatoarelor conțin un singur circuit pentru efectuarea operațiilor AND, SAU și adunare pe două cuvinte mașină De obicei, acest circuit pentru cuvinte pe n biți constă din n circuite identice, câte unul pentru fiecare poziție de bit Figura prezintă o astfel de schemă, care se numește aritme- Capitolul Nivel logic digital unitate tico-logică (ALU) Acest dispozitiv poate calcula una dintre următoarele funcții: A AND B, L SAU B, B sau A + B Alegerea funcției depinde de ce semnale sunt recepționate pe liniile Fo și Ff , , sau AND (în sistem de numere binar) Rețineți că aici A + B înseamnă suma aritmetică a lui L și B și nu operația logică AND Ieșire transfer Orez Un singur bit ALU În colțul din stânga jos al circuitului este un decodor pe doi biți care generează semnale de pornire pentru patru operațiuni Alegerea funcționării este determinată de semnalele de control Fo și În funcție de valorile Fo și Fx, se selectează una dintre cele patru linii de activare, iar apoi semnalul de ieșire al funcției selectate trece prin ultima poartă SAU În colțul din stânga sus al diagramei este un dispozitiv logic pentru calcularea funcțiilor L AND V, L OR V și V, dar numai unul dintre aceste rezultate trece prin ultima poartă SAU, în funcție de care dintre liniile de activare are decodorul ales Deoarece exact unul dintre semnalele de ieșire ale decodorului poate Circuite logice digitale de bază fie egal cu , atunci exact una dintre cele patru porți AND va începe Cele trei porți rămase vor scoate indiferent de valorile lui A și B ALU poate efectua nu numai operații logice și aritmetice asupra variabilelor A și B, ci și să le facă egale cu zero prin anularea ENA (enable signal A) sau ENB (enable signal B) De asemenea, puteți obține A setând semnalul INVA (inversează A) Vom vedea de ce sunt necesare ENA, ENB și INVA în Capitolul În condiții normale, atât ENA cât și ENB sunt pentru a permite ambele intrări, iar INVA este În acest caz, A și B merg pur și simplu la unitatea logică fara modificari În colțul din dreapta jos este o sumătoare completă pentru calcularea sumei lui A și B, precum și pentru efectuarea transferurilor Semnificațiile sunt necesare deoarece mai multe astfel de circuite pot fi conectate pentru a efectua operații pe cuvinte întregi Circuite cu un singur bit precum cel prezentat în Fig sunt numite secțiuni de microprocesor de biți Acestea permit dezvoltatorului să construiască un ALU de orice capacitate Pe fig prezintă o diagramă a unei ALU pe biți, compusă din opt secțiuni pe un singur bit Semnalul INC (incrementare cu unu) este necesar doar pentru operațiuni de adăugare Face posibilă calcularea unor sume precum A + și A + B + fi transfer transfer Orez Opt secțiuni cu un singur bit conectate pentru a forma un ALU de biți Pentru a simplifica circuitul, semnalele de activare și inversare nu sunt afișate Generatoare de ceas În multe circuite digitale, totul depinde de ordinea operațiilor Uneori o operație trebuie să precedă alta, alteori două operații trebuie să aibă loc în același timp Pentru a controla parametrii de sincronizare, generatoarele de ceas sunt încorporate în circuitele digitale pentru a asigura sincronizarea Un generator de ceas este un circuit care provoacă o serie de impulsuri Toate impulsurile au aceeași durată Intervalele dintre impulsurile succesive sunt de asemenea aceleași Intervalul de timp dintre începutul unui impuls și începutul următorului se numește timp takt Frecvența pulsului este de obicei între și MHz, ceea ce corespunde unui ciclu de ceas de până la ns Frecvența oscilatorului ceasului este de obicei controlată de un oscilator cu cristal pentru a obține o precizie ridicată Capitolul Nivel logic digital Multe lucruri se pot întâmpla într-un computer în timpul unui ciclu Dacă urmează să fie efectuate într-o anumită ordine, atunci măsura ar trebui împărțită în subcicluri Pentru a obține o rezoluție mai bună decât ceasul principal, trebuie să ramificați linia principală a ceasului și să introduceți un circuit cu un anumit timp de întârziere Așa se generează semnalul secundar al generatorului de ceas, decalat în fază față de cel primar (Fig , a) Diagrama de timp prezentată în fig , b, oferă patru puncte de origine pentru evenimente discrete: Față Refuza miercuri Fata C Recesiune C Prin asocierea diferitelor evenimente cu diferite scăderi (fronturi și recesiuni), puteți realiza succesiunea dorită de acțiuni Dacă sunt necesare mai mult de patru puncte de referință într-un ciclu, mai multe ramuri de la linia principală pot fi făcute cu timpi de întârziere diferiți Orez Generator de ceas (a); diagrama de timp a generatorului de ceas (b); generarea de impulsuri de ceas asincrone (c) În unele circuite, intervalele de timp sunt importante, nu timpii discreti De exemplu, un eveniment poate să apară nu în partea din față a pulsului, ci în orice moment când nivelul pulsului C\ este ridicat Un alt eveniment poate apărea numai atunci când nivelul pulsului C este ridicat Dacă sunt necesare mai mult de două intervale, furnizați mai multe linii de ceas sau faceți ca stările de puls ridicat ale celor două ceasuri să se suprapună parțial în timpul Memorie timp În acest din urmă caz se pot distinge intervale separate: Q AND C , Cj AND C , AND C și AND C Generatoarele de ceas pot fi sincrone În acest caz, durata de viață a unui impuls de nivel înalt este egală cu durata de viață a unui impuls de nivel scăzut (vezi Fig , b) Pentru a obține un tren asincron de impulsuri (a se vedea semnalul C în Fig , c), trebuie să deplasați semnalul oscilatorului principal folosind un circuit de întârziere Apoi trebuie să conectați semnalul recepționat cu semnalul original folosind funcția logică AND Memorie Memoria este o componentă necesară a oricărui computer Fără memorie, nu ar exista computere, cel puțin nu cele pe care le avem acum Memoria este folosită pentru a stoca atât instrucțiuni, cât și date În următoarele subsecțiuni, ne vom uita la principalele componente ale memoriei, începând de la nivelul porții Vom vedea cum funcționează, cum pot fi folosite pentru a construi memorie de mare capacitate Încuietori Pentru a crea un bit de memorie, aveți nevoie de un circuit care cumva "își amintește" valorile anterioare de intrare Un astfel de circuit poate fi construit din două porți NOR, așa cum se arată în Fig a Circuite similare pot fi construite din porți NAND Nu vom menționa aceste circuite în continuare, deoarece sunt în esență identice cu circuitele cu porți NOR Orez zăvor NOR în starea (a); zăvor NOR în starea (b); tabel de adevăr pentru funcția NOR (c) Schema prezentată în fig , a, se numește zăvor SR Are două intrări: S (Setare - setări R (Resetare - resetare) Are și două ieșiri complementare: Q și Q Spre deosebire de circuitul combinatoriu, semnalele de ieșire ale latch-ului nu sunt determinate de semnalele de intrare curente Pentru a înțelege cum funcționează zăvorul, să presupunem că S = și R = (în general, semnalul la aceste intrări este de cele mai multe ori) Să presupunem de asemenea că ( = Deoarece Q revine la poarta NOR de sus și ambele intrări ale acesteia Capitolul Nivel logic digital porțile sunt , apoi ieșirea sa, Q, este Una se întoarce la poarta de jos, care se termină cu o intrare , cealaltă , iar ieșirea este = Această stare de lucruri este cel puțin consistentă (vezi Fig , a) Acum să ne imaginăm că Q = și R și S sunt încă Poarta de sus are intrări și și o ieșire Q (adică ) care merge înapoi la poarta de jos Această stare de fapt, prezentată în fig b este de asemenea consecvent Situația în care ambele ieșiri sunt nu este valabilă, deoarece în acest caz ambele porți ar avea două zerouri la intrare, ceea ce ar duce la unul la ieșire, nu zero În mod similar, nu este posibil să avem ambele ieșiri egale cu , deoarece asta ar avea ca rezultat ca ambele intrări să fie și , ceea ce face ca rezultatul să fie , nu Derivarea noastră este simplă: la ? = S = zăvorul are două stări stabile, pe care le vom numi și în funcție de Q Acum să luăm în considerare efectul semnalelor de intrare asupra stării latch-ului Să presupunem că S ia valoarea în timp ce Q = Atunci intrările la poarta superioară sunt atât , cât și , ducând la o ieșire de = Această modificare face ca ambele intrări către poarta de jos să fie egale cu și, prin urmare, ieșirea este Astfel, setarea S la comută starea de la la Setarea R la când zăvorul este în starea nu provoacă modificări deoarece ieșirea porții NOR de jos este pentru ambele intrări și AND Folosind acest argument, este ușor de observat că setarea S la cu starea de blocare (adică, Q = ) nu provoacă nicio modificare, dar setarea R la determină schimbarea stării de blocare Astfel, dacă S este , atunci este egal cu , indiferent de starea anterioară a zăvorului În mod similar, schimbarea R la determină Q = Circuitul "îți amintește" dacă ultimul semnal a fost S sau R Folosind această proprietate, putem construi memoria computerului Încuietori SR sincron Este adesea convenabil să aveți o stare de schimbare a zăvorului numai la anumite momente Pentru a atinge acest obiectiv, vom schimba ușor circuitul principal și vom obține un blocaj SR sincron (Figura ) generator de ceas Orez Încuietoare SR sincronă Acest circuit are o intrare suplimentară de ceas, care este în mare parte Dacă această intrare este , atunci ambele ieșiri ale porților AND sunt și, indiferent de valorile lui S și R, zăvorul nu își schimbă starea Când Memorie Când intrarea ceasului este setată la , porțile AND sunt dezactivate, iar zăvorul devine dependent de și Termenii turn-on și gating sunt adesea folosiți pentru a indica faptul că o intrare de ceas este una Până acum, nu ne-am dat seama ce se întâmplă când S = R = Și din motive evidente: când ambii și revin în cele din urmă la , circuitul devine nedeterminist Singura stare acceptabilă la = = este Q = Q = , dar de îndată ce ambele intrări revin la , zăvorul trebuie să intre în una dintre cele două stări stabile Dacă una dintre intrări merge la înaintea celeilalte, cea care rămâne în starea "câștigă" deoarece este singura intrare care controlează starea latch-ului Dacă ambele intrări merg la în același timp (ceea ce este foarte puțin probabil), latch-ul alege una dintre stările sale stabile aleatoriu Încuietori D sincron Pentru a rezolva situația cu incertitudinea SR-latch (incertitudinea apare dacă S = = ), trebuie să preveniți apariția acesteia Pe fig Figura prezintă un circuit de blocare cu o singură intrare D Deoarece intrarea către poarta AND de jos este întotdeauna inversa intrării către poarta AND de sus, situația în care ambele intrări sunt nu apare niciodată Când D = și intrarea ceasului este , blocarea trece în starea Q = Când D = și intrarea ceasului este , blocarea trece în starea Q = Cu alte cuvinte, când intrarea ceasului este , valoarea curentă a lui D este eșantionată și stocată într-un dispozitiv de blocare Acest circuit, numit D-latch sincron, este o memorie de bit Valoarea stocată este întotdeauna disponibilă la ieșirea Q Pentru a încărca valoarea curentă a lui D în memorie, trebuie aplicat un impuls pozitiv liniei de semnal de ceas Un astfel de circuit necesită tranzistori AND Circuitele mai complexe (care sunt cele utilizate în mod obișnuit în practică) pot stoca bit pe doar tranzistoare declanșatoare Multe circuite, dacă este necesar, selectează o valoare pe o anumită linie la un moment dat în timp și o amintesc Într-o astfel de schemă, care se numește flip-flop, o schimbare de stare nu are loc la sincronizare Capitolul Nivel logic digital semnalul este , iar când semnalul ceasului se schimbă de la la (margine) sau de la la (în scădere) Prin urmare, lungimea impulsului ceasului nu contează, deoarece tranzițiile sunt rapide Să subliniem din nou diferența dintre un flip-flop și un zăvor Declanșatorul este declanșat de margine, iar zăvorul este declanșat de nivel Rețineți că acești termeni sunt adesea confuzi în literatură Mulți autori folosesc termenul "flip-flop" atunci când se referă la un zăvor și invers Există mai multe abordări pentru dezvoltarea declanșatorilor De exemplu, dacă ar exista o modalitate de a genera un impuls foarte scurt la marginea ascendentă a semnalului de ceas, acel impuls ar putea fi aplicat la D-latch-ul De fapt, există o astfel de cale Circuitul corespunzător este prezentat în Fig , a d buc A Cu b A Timp b Orez Generator de impulsuri (a); diagramă de timp pentru patru puncte din diagrama (b) La prima vedere, poate părea că ieșirea porții AND va fi întotdeauna zero, deoarece funcția AND a oricărui semnal cu inversarea sa dă , dar în realitate situația este ceva mai complicată Când semnalul trece prin invertor, există o întârziere mică, dar nu zero Această schemă funcționează tocmai din cauza acestei întârzieri Să presupunem că măsurăm tensiunea în patru puncte: a, b, c și d Semnalul de intrare la punctul a este un impuls lung de ceas (graficul inferior din Figura b) Semnalul din punctul b este afișat deasupra acestuia Rețineți că acest semnal este inversat și este alimentat În literatura internă, termenul "latch" (latch) nu este folosit deloc, se vorbește despre declanșatoare Cu toate acestea, aceasta introduce conceptul de declanșare T, care este declanșatorul "adevărat" - Notă științific ed Memorie cu oarecare întârziere Timpul de întârziere depinde de tipul de invertor și este de obicei de câteva nanosecunde Semnalul de la punctul c este de asemenea întârziat, dar această întârziere se datorează doar timpului necesar semnalului pentru a călători (la viteza luminii) Dacă distanța fizică dintre punctele a și c este, de exemplu, de de microni, atunci întârzierea de propagare a semnalului este de , ns, ceea ce este desigur neglijabil în comparație cu timpul de călătorie a semnalului prin invertor Astfel, semnalul din punctul c este aproape identic cu semnalul din punctul a Când semnalele de intrare bis sunt AND, rezultatul este un impuls scurt a cărui lungime (A) este egală cu întârzierea porții a invertorului (de obicei ns sau mai puțin) Semnalul de ieșire al porții AND este un impuls dat, deplasat din cauza întârzierii porții AND (graficul de sus din Fig , b) Această decalare a timpului înseamnă doar că D-latch-ul este activat cu o anumită întârziere după frontul ascendent al pulsului de ceas Nu afectează în niciun fel lungimea pulsului Într-o memorie cu un timp de ciclu de ns, impulsul de ns (care spune când să selecteze linia D) este suficient de scurt, caz în care circuitul complet ar putea fi ca în Fig Trebuie menționat faptul că o astfel de schemă de declanșare este ușor de înțeles, dar de obicei declanșatoarele mai complexe sunt utilizate în practică Denumirile standard pentru zăvoare și flip-flops sunt prezentate în fig Pe fig a prezintă un zăvor a cărui stare este încărcată atunci când semnalul de ceas CK (din cuvântul ceas) este , spre deosebire de zăvorul prezentat în fig b, al cărui semnal de ceas este în mod normal , dar merge la pentru a încărca starea din linia D În fig , c și d arată declanșatorii Faptul că acestea sunt flip-flops, nu zăvoare, este indicat de un colț pe intrarea de sincronizare Declanșatorul din fig , schimbă starea din fața pulsului de ceas (tranziție de la la ), în timp ce declanșatorul din fig , r schimbă starea în declin (tranziție de la la ) Multe (deși nu toate) zăvoare și flip-flop au, de asemenea, o ieșire Q, iar unele au două intrări suplimentare: Set (set) sau Preset (preset) și Reset (resetare) sau Cieag (clear) Prima intrare (Setare sau Presetare) setează Q = , iar a doua (Resetare sau Clear) setează Q = Capitolul Nivel logic digital DQ DQ DQ DQ SC SC >SC SC A b V Orez Încuietori D și șlapi D Registrele Există diverse configurații de declanșare Pe fig a prezintă un circuit care conține două flip-flops D independente cu semnale prestabilite și clare Deși aceste două flip-flop sunt pe același cip cu pini, nu sunt conectate Declanșatorul "de opt ori" prezentat în Fig b Aici, spre deosebire de circuitul anterior, opt flip-flop nu au o ieșire Q și linii presetate, iar toate liniile de ceas sunt conectate împreună și controlate de pinul I Flip-flops-urile în sine sunt de același tip ca în fig , d, dar intrările inversoare sunt anulate de invertorul asociat pinului AND, astfel încât flip-flops-urile sunt declanșate la o tranziție de la la Toate cele opt semnale clare sunt de asemenea combinate, deci atunci când pinul trece în starea , toate bistabilele trec în starea Dacă nu este clar de ce pinul este inversat la intrare și apoi inversat din nou cu fiecare semnal SC, răspunsul este simplu: semnalul de intrare nu are suficientă putere pentru a declanșa toate cele opt papuci flip-flop; invertorul de intrare este de fapt folosit ca amplificator Unul dintre motivele pentru combinarea liniilor de sincronizare și a liniilor clare în microcircuitul din Fig , b - economia concluziilor În același timp, microcircuitul acestei configurații este oarecum diferit de cele opt flip-flop fără legătură și este folosit ca un registru de biți Două astfel de microcircuite pot funcționa în paralel, formând un registru de biți Pentru a face acest lucru, trebuie să legați concluziile corespunzătoare și I Vom lua în considerare registrele și aplicarea lor mai detaliat în Capitolul Organizarea memoriei Deși am făcut tranziția de la o memorie simplă de biți (vezi Figura ) la o memorie de biți (vezi Figura b), construirea unei memorie mari necesită un mod diferit de organizare, în care puteți accesa cuvinte individuale Un exemplu de organizare a memoriei care satisface acest criteriu este prezentat în Fig Această memorie conține patru cuvinte de biți Fiecare operație citește sau scrie un întreg cuvânt de biți Deși cantitatea totală de memorie ( biți) nu este cu mult mai mare decât cea a unui flip-flop de biți, aceasta Memorie Ce memorie necesită mai puțini pini și, cel mai important, o astfel de organizare este aplicabilă pentru construirea unei memorie mari A Orez Declanșator dublu D (a), declanșator "opt" (b) Capitolul Nivel logic digital OE DQ DQ DQ Cuvântul O ->SK >SK >SK Cuvântul Cuvântul Cuvântul CS RD Scrie poarta Linia de eșantionare a cuvântului O Ai Aq Date de intrare h - DQ DQ- DQ- >SK ->SK ->SK DQI D SP >SK Oi O Oz Rezoluție de ieșire = CS • RD • OE Orez Diagrama bloc logica pentru memorie x Fiecare rând reprezintă unul dintre cuvintele de biți Când citiți și scrieți, un cuvânt întreg este întotdeauna citit sau scris Exemplu de cuvânt rândul Exemplu de cuvânt rândul CS-RD DQ DQ F*SK ■>SC >SK DQ- -|DQ-] ■>ck ->sk Deși organizarea memoriei prezentată în Fig poate părea complicat la prima vedere, dar este de fapt foarte simplu datorită structurii sale regulate Microcircuitul conține linii de intrare, în special intrări pentru date - Io, Ii și I ; intrari pentru adrese - Ao si At; intrări pentru control - CS (Chip Select - selectarea unui element de memorie), RD (ReaD - citire, acest semnal vă permite să distingeți citirea de scriere) și OE (Output Enable - permisiunea de a emite semnale de ieșire), precum și linii de ieșire pentru date - O , Ot și O O astfel de memorie poate fi plasată în principiu într-un pachet cu pini (inclusiv putere și masă), iar un flip-flop de biți necesită de pini Memorie Pentru a selecta un cip de memorie, logica externă trebuie să seteze semnalul CS la și, de asemenea, să seteze semnalul RD la pentru citire și pentru scriere Cele două linii de adresă trebuie să indice care dintre cele patru cuvinte de biți urmează să fie citit sau scris La citire, liniile de introducere a datelor nu sunt utilizate Un cuvânt este selectat și plasat pe liniile de ieșire a datelor La scriere, biții de pe liniile de intrare de date sunt încărcați în cuvântul de memorie selectat; liniile de ieșire nu sunt utilizate Acum să vedem cum memoria prezentată în Fig Cele patru porti SI pentru selectarea cuvintelor din partea stanga a circuitului formeaza un decodor Invertoarele de intrare sunt aranjate astfel încât fiecare poartă să fie condusă de o anumită adresă Fiecare poartă conduce o linie de selecție a cuvintelor (pentru cuvintele , , și ) Când cipul este pe cale să scrie, linia verticală CSRD este setată la , activând una dintre cele patru porți de scriere Alegerea porții depinde de ce linie de selectare a cuvântului este Ieșirea porții de scriere conduce toate semnalele CK pentru cuvântul selectat, încărcând datele de intrare în flip-flop pentru acel cuvânt Se face o scriere numai dacă semnalul CS este și RD este și se scrie doar cuvântul selectat de adresele Ao și At; restul cuvintelor nu se schimbă Procesul de citire este similar cu cel de scriere Decodificarea adreselor are loc exact în același mod ca atunci când scrieți Dar, în acest caz, linia CSRD este setată la , deci toate porțile de scriere sunt dezactivate și niciunul dintre flip-flops nu se schimbă În schimb, linia de selectare a cuvântului declanșează porțile AND asociate cu biții Q ai cuvântului selectat Astfel, cuvântul selectat își alimentează datele la porțile SAU cu intrări situate în partea de jos a circuitului, iar celelalte trei cuvinte ies Prin urmare, ieșirea porților SAU este identică cu valoarea stocată în acel cuvânt Cele trei cuvinte rămase nu afectează în niciun fel rezultatul Am putea proiecta un circuit în care trei porți SAU să fie conectate la trei linii de ieșire de date, dar acest lucru ar cauza unele probleme Am tratat liniile de intrare a datelor și liniile de ieșire a datelor ca linii diferite În practică, se folosesc aceleași linii Dacă am conecta porțile SAU la liniile de ieșire a datelor, cipul ar încerca să scoată date (adică să seteze fiecare linie la o anumită valoare) chiar și în timpul procesului de scriere, interferând cu intrarea normală a datelor Din acest motiv, este de dorit să conectați cumva porțile SAU la liniile de ieșire a datelor atunci când citiți și să le deconectați complet când scrieți Tot ce avem nevoie este un comutator electronic care se poate conecta și deconecta în câteva nanosecunde Din fericire, astfel de comutatoare există Pe fig , este prezentată o imagine simbolică a așa-numitului element tampon fără inversare Conține o linie de intrare a datelor, o linie de ieșire a datelor și o linie de intrare de control Când intrarea de control este , elementul tampon acţionează ca un conductor (Fig b) Când intrarea de control este , elementul tampon acționează ca un izolator (Figura c), ca și cum cineva ar tăia ieșirea de date din restul circuitului cu tăietori de sârmă Conexiunea poate fi restabilită în câteva nanosecunde setând semnalul de control la Capitolul Nivel logic digital Intrare ieșire Control a B C D Orez Element tampon fără inversare (a); reprezentarea elementului tampon fără inversare când semnalul de control este (b); reprezentarea elementului tampon fără inversare când semnalul de control este (c); element tampon cu inversare (r) Pe fig Figura d prezintă un element tampon inversat care acționează ca un invertor convențional când semnalul de control este și separă ieșirea de restul circuitului când semnalul de control este Ambele elemente tampon sunt dispozitive cu trei stări, deoarece pot ieși un semnal zero , un singur semnal sau niciun semnal (caz cu circuit deschis) Elementele tampon amplifică, de asemenea, semnalele, astfel încât să poată gestiona mai multe semnale în același timp Uneori sunt folosite în circuite ca amplificatoare Până acum, ar trebui să vă fie clar de ce aveți nevoie de trei elemente tampon fără inversare pe liniile de ieșire a datelor Când semnalele CS, RD și OE sunt , semnalul de activare a ieșirii este, de asemenea, , ca urmare, elementele tampon sunt declanșate și un cuvânt este plasat pe liniile de ieșire Când unul dintre semnalele CS, RD și OE este , ieșirile sunt deconectate de la restul circuitului Cip-uri de memorie Avantajul memoriei prezentate în Fig este că o astfel de structură este aplicabilă în dezvoltarea memoriei mari Figura prezintă un circuit x (pentru patru cuvinte a câte biți fiecare) Pentru a-l extinde la x , trebuie să adăugați încă coloane de declanșare cu câte declanșatori fiecare, precum și linii de intrare și de ieșire Pentru a trece de la un model x la un model x , trebuie să adăugați încă patru rânduri de flip-flops cu trei flip-flops fiecare, precum și o linie de adresă Ar Cu această structură, numărul de cuvinte din memorie trebuie să fie o putere de doi pentru o eficiență maximă, iar numărul de biți dintr-un cuvânt poate fi orice Tehnologia de fabricație a circuitelor integrate se potrivește perfect cu structura obișnuită a cipurilor de memorie Pe măsură ce tehnologia avansează, numărul de biți care se pot potrivi pe un singur cip crește constant, dublându-se de obicei la fiecare luni (legea lui Moore) Odată cu apariția cipurilor mari, cipurile mici nu devin întotdeauna imediat învechite, deoarece există întotdeauna un compromis între capacitate, viteză, putere, preț și ușurința de interfață De obicei, cele mai mari cipuri moderne sunt la mare căutare și, prin urmare, costă mult mai mult pe bit decât cipurile mici Memorie Cu orice cantitate de memorie, există mai multe opțiuni pentru organizarea microcircuitului Pe fig Figura prezintă două structuri posibile pentru un cip de Mb: K x și K x (dimensiunile cipurilor de memorie sunt de obicei date în biți, nu în octeți, așa că vom rămâne la această convenție aici) Pe fig , dar puteți vedea linii de adresă pentru accesarea unuia dintre cei de octeți și linii de date pentru încărcarea sau stocarea octetului selectat A Orez Două moduri de organizare a memoriei de Mb b Să facem o mică remarcă despre terminologie La unele terminale, tensiunea ridicată provoacă unele acțiuni, la altele, tensiunea scăzută rămâne Pentru a evita confuzia, vom folosi termenul de semnal set atunci când este apelată o acțiune, în loc să spunem că tensiunea crește sau scade Astfel, pentru unele iesiri, setarea semnalului inseamna setarea unitatii, pentru altele, setarea semnalului la zero Numele PIN care sunt setate la au o supralinie Adică semnalul CS este unul, semnalul CS este zero Termenul opus este aruncarea Și acum înapoi la microcircuitul nostru Deoarece un computer conține de obicei multe cipuri de memorie, este nevoie de un semnal pentru a selecta cip-ul necesar, astfel încât cipul de care avem nevoie să răspundă la apel, iar restul nu Semnalul CS (Chip Select) este utilizat în acest scop Este instalat pentru a porni cipul În plus, avem nevoie de o modalitate de a face distincția între citiri și scrieri Semnalul WE (Write Enable) indică faptul că datele trebuie scrise, nu citite În cele din urmă, semnalul OE (Output Enable) este setat să furnizeze semnale de ieșire Când acest semnal nu este prezent, ieșirea este deconectată de la restul circuitului Capitolul Nivel logic digital Pe fig , b folosește o schemă de adresare diferită Microcircuitul este o matrice de x celule de un bit, care este de Mbps Pentru a accesa un cip, trebuie mai întâi să selectați un rând Pentru a face acest lucru, numărul I-digit al acestei linii este transmis la ieșirile de adresă Apoi este setat semnalul RAS (Row Address Strobe) După aceea, numărul coloanei este aplicat pinilor de adresă și este setat semnalul CAS (Column Address Strobe) Microcircuitul reacționează la semnal prin primirea sau ieșirea de bit de date Cipurile de memorie mari sunt adesea fabricate ca matrice m x n, accesate în rânduri și coloane Această organizare a memoriei reduce numărul de pini necesari, dar, pe de altă parte, încetinește accesul la microcircuit, deoarece sunt necesare două cicluri de adresare: unul pentru rând, celălalt pentru coloană Pentru a accelera acest proces, unele cipuri pot apela o adresă de rând și apoi mai multe adrese de coloane pentru a accesa biții seriali ai rândului Cu mulți ani în urmă, cele mai mari cipuri de memorie erau de obicei aranjate așa cum se arată în Fig b Deoarece dimensiunea cuvântului a crescut de la la de biți și mai mult, a devenit incomod să folosiți astfel de microcircuite Pentru a construi memorie cu cuvinte de de biți din microcircuite de K x , sunt necesare de microcircuite, care funcționează în paralel Aceste de cipuri au o capacitate totală de cel puțin MB Dacă utilizați K x cipuri, veți avea nevoie de doar cipuri, dar memoria va fi de MB Pentru a nu se încurca cu de cipuri, majoritatea producătorilor produc familii de cipuri cu lungimi de cuvinte de , , și biți Situația cu cuvintele pe de biți este, desigur, și mai rea Exemple de cipuri moderne cu o capacitate de Mbit sunt prezentate în fig Fiecare astfel de cip conține patru bănci de memorie internă de Mbit fiecare; în consecință, sunt necesare două linii de selecție a băncii pentru a defini o bancă Pe chipul de M x prezentat în fig , a, sunt alocate linii pentru semnalele RAS, - pentru semnalele CAS și linii - pentru selecția băncii Luate în ansamblu, de semnale oferă capacitatea de a adresa de celule interne de biți Pe un microcircuit de M x , prezentat în fig , b, linii sunt alocate pentru semnalele RAS, linii pentru CAS și linii pentru selecția băncii Astfel, de semnale fac posibilă adresarea oricăreia dintre cele de celule interne de biți Numărul de rânduri și coloane din jetoane este determinat pe baza factorilor de inginerie Matricea nu trebuie să fie pătrată Aceste exemple demonstrează clar importanța a două probleme fără legătură în procesul de proiectare a cipurilor de memorie Primul se referă la lățimea ieșirii (în biți) - cu alte cuvinte, numărul de biți ( , , , etc ) din semnalul de ieșire A doua problemă este modul în care sunt reprezentați biții de adresă; Există două opțiuni aici: în primul rând, biții de adresă pot fi prezentați simultan pe diferiți pini și, în al doilea rând, poate exista o reprezentare secvențială a rândurilor și coloanelor - așa cum se arată în Fig Înainte de a continua cu proiectarea microcircuitului, specialistul trebuie să decidă asupra soluției la ambele probleme Memorie SA A A AZ A A A A A A A O A A RAS CLS Banca O Banca Cip de memorie Mx ( Mbit) D D D D CS WE OE Orez Două moduri de a organiza un cip de memorie de Mbit RAM și ROM Toate tipurile de memorie pe care le-am considerat până acum au un lucru în comun: permit atât scrierea, cât și citirea informațiilor Această memorie se numește RAM (Random Access Memory) sau RAM (Random Access Memory) Există două tipuri de RAM: statică și dinamică RAM statică (SRAM) este construită folosind D-flip-flops Informațiile din RAM sunt stocate atâta timp cât îi este furnizată energie: secunde, minute, ore și chiar zile RAM statică este foarte rapidă De obicei, timpul de acces este de câteva nanosecunde Din acest motiv, RAM statică este adesea folosită ca cache de nivel al doilea În RAM dinamică (Dynamic RAM, DRAM), dimpotrivă, nu se folosesc flip-flops DRAM este o serie de celule, fiecare conținând un tranzistor și un mic condensator Condensatorii pot fi încărcați și descărcați, ceea ce vă permite să stocați zerouri și unități Deoarece sarcina electrică tinde să dispară, fiecare bit din DRAM trebuie actualizat (reîncărcat) la fiecare câteva milisecunde pentru a preveni scurgerea datelor Deoarece logica externă trebuie să se ocupe de actualizare, DRAM necesită o interfață mai complexă decât RAM statică, deși acest dezavantaj este compensat de volumul mare Deoarece DRAM are nevoie doar de tranzistor și condensator pe bit (RAM statică are nevoie de tranzistori pe bit în cel mai bun caz), DRAM are o densitate de scriere foarte mare (mulți biți pe cip) Din acest motiv, memoria principală este aproape întotdeauna construită Capitolul Nivel logic digital bazat pe RAM dinamică Cu toate acestea, DRAM-urile sunt foarte lente (timpul de acces durează zeci de nanosecunde) Astfel, combinația de cache bazată pe RAM statică și memorie principală bazată pe RAM dinamică combină avantajele ambelor dispozitive Există mai multe tipuri de RAM dinamică Cel mai vechi tip încă utilizat este FPM (Fast Page Mode) Această memorie RAM este o matrice de biți Hardware-ul reprezintă adresa rândului și apoi adresele coloanei (am descris acest proces când am vorbit despre dispozitivul de memorie prezentat în Figura b) Semnalele explicite asigură funcționarea asincronă a memoriei și a generatorului principal de ceas al sistemului FPM este înlocuit treptat de memoria EDO (Extended Data Output) , care permite accesarea memoriei înainte ca accesul anterior să se încheie Acest mod pipeline, deși nu accelerează accesul la memorie, îmbunătățește debitul permițând mai multe cuvinte pe secundă Memoriile precum FPM și EDO au rămas relevante în acele zile când timpul de ciclu al cipurilor de memorie nu depășea ns Ulterior, odată cu creșterea vitezei procesoarelor, s-a format nevoia de cipuri de memorie mai rapide, iar apoi modurile asincrone FPM și EDO au fost înlocuite cu RAM dinamică sincronă (Synchronous DRAM, SDRAM) DRAM-ul sincron este controlat de un singur semnal de ceas Acest dispozitiv este un hibrid de memorie RAM statică și dinamică Principalul avantaj al RAM dinamică sincronă este că elimină dependența cipului de memorie de semnalele de control CPU-ul spune memoriei câte cicluri să ruleze și apoi pornește acele cicluri Fiecare ciclu emite , sau biți, în funcție de numărul de linii de ieșire Eliminarea dependenței de semnalele de control duce la o creștere a ratei de transfer de date între CPU și memorie Următorul pas în evoluția SDRAM a fost memoria DDR (Double Data Rate) Această tehnologie oferă date de ieșire atât în față, cât și la scăderea pulsului, drept urmare rata de transfer este dublată De exemplu, un cip de biți de acest tip, care rulează la MHz, emite două valori de biți de de milioane de ori pe secundă (desigur, această viteză este menținută pentru o perioadă scurtă de timp); astfel, teoretic, viteza pe termen scurt poate ajunge la , GB/s Memorie non volatila RAM nu este singurul tip de cipuri de memorie În multe cazuri, datele trebuie păstrate chiar dacă alimentarea este oprită (de exemplu, când vine vorba de jucării, diverse dispozitive și mașini) Mai mult, după instalare Memoria dinamică de tip EDO a înlocuit practic memoria dinamică convențională care funcționează în modul FPM la mijlocul anilor - Notă științific ed Memorie programele sau datele nu trebuie modificate Aceste cerințe au condus la apariția ROM (memorie doar în citire) sau ROM (Memorie numai în citire - memorie doar în citire) ROM-urile nu permit modificarea și ștergerea informațiilor stocate în ele (nici intenționat, nici accidental) Datele sunt scrise pe ROM în timpul producției Pentru a face acest lucru, se realizează un șablon cu un anumit set de biți, care este suprapus pe un material fotosensibil, iar apoi părțile deschise (sau închise) ale suprafeței sunt gravate Singura modalitate de a schimba programul în ROM este schimbarea întregului cip ROM-urile sunt mult mai ieftine decât RAM dacă sunt comandate în vrac pentru a plăti costul realizării unui șablon Cu toate acestea, acestea nu permit modificări după lansarea din producție și pot dura câteva săptămâni între o comandă ROM și finalizarea acesteia Pentru a face mai ușor pentru companii să dezvolte noi dispozitive bazate pe ROM, au fost lansate ROM-uri programabile (ROM-uri programabile, PROM-uri) Spre deosebire de ROM-urile convenționale, acestea pot fi programate pe teren pentru a reduce timpii de livrare Multe ROM-uri programabile conțin o serie de legături fuzibile mici Pentru a arde un anumit jumper, trebuie să selectați rândul și coloana necesare, apoi aplicați o tensiune înaltă unui anumit pin al microcircuitului Următoarea dezvoltare a acestei linii este un ROM programabil șters (Erasable PROM, EPROM), care poate fi programat în teren, precum și ștergerea informațiilor din acesta Dacă fereastra de cuarț din acest ROM este expusă la lumină ultravioletă puternică timp de minute, toți biții vor fi setați la Dacă trebuie făcute multe modificări în timpul unui singur pas de proiectare, ROM-urile ștergebile sunt mult mai economice decât ROM-urile obișnuite, deoarece pot fi refolosit de multe ori ROM-urile programabile șterse sunt de obicei aranjate în același mod ca RAM-urile statice De exemplu, cipul C are o structură care este prezentată în Fig , a, și o astfel de structură este tipică pentru RAM statică Următoarea etapă este un ROM reprogramabil electronic (Electronic EPROM, EEPROM), din care informațiile pot fi șterse prin aplicarea de impulsuri și care nu trebuie să fie plasată într-o cameră specială pentru a o expune la razele ultraviolete În plus, pentru a reprograma acest dispozitiv, nu este nevoie să fie introdus într-un dispozitiv special pentru programare, spre deosebire de un ROM programabil șters În același timp, cele mai mari EEPROM-uri sunt de de ori mai mici decât EEPROM-urile obișnuite și funcționează la jumătate din viteză EEPROM-urile nu pot concura cu DRAM-urile și SRAM-urile deoarece sunt de ori mai lente, au o capacitate de de ori mai mică și sunt mult mai scumpe Ele sunt utilizate numai în acele situații în care este necesar să se salveze informații atunci când alimentarea este oprită Un tip mai modern de EEPROM este memoria flash Spre deosebire de ROM-ul care se șterge, care este șters prin expunerea la razele ultraviolete, și de EEPROM, care este șters octet cu octet, memoria flash este ștearsă și scrisă în blocuri Mulți producători produc plăci de circuite imprimate mici care conțin sute de mega- Capitolul Nivel logic digital octeți de memorie flash Sunt folosite pentru a stoca imagini în camere digitale și în alte scopuri Poate că într-o zi flash-ul va înlocui discurile, ceea ce ar fi un pas uriaș înainte, având în vedere timpul de acces de ns Principala problemă tehnică în acest moment este că memoria flash se uzează după de ștergeri, iar discurile pot dura ani de zile, indiferent de câte ori sunt suprascrise O scurtă descriere a diferitelor tipuri de memorie este dată în tabel Tabelul Caracteristicile diferitelor tipuri de memorie Tip dispozitiv de stocare Categorie Șterge informații Schimbați informații în funcție de octeți Necesar de alimentare Aplicație SRAM Citire/Scriere Electrică Da Da L Cache DRAM Citire/Scriere Electrică Da Da Memorie principală (vechită) SDRAM Citire/Scriere Electrică Da Da Memorie principală (modele noi) ROM Numai citire Imposibil Nu Nu Dispozitive masive PROM Numai citire Nu este posibil Nu Nu Dispozitive de volum mic EPROM Citește predominant lumina UV Nu Fără Simulare dispozitiv EEPROM Citite predominant Electrice Da Nu Simulare dispozitiv Memorie flash Citire și scriere Electrică Nu Nu Camere digitale Chip-uri și magistrale de procesor Deoarece ne-am familiarizat deja cu cipurile MIS și SIS, precum și cu cipurile de memorie, acum putem pune toate componentele împreună și începem să studiem sisteme întregi În această secțiune, ne uităm mai întâi la procesoarele la nivel logic digital, inclusiv la pinouts (adică la semnificația semnalelor de pe diferiții pini) Deoarece CPU-urile sunt strâns legate de magistralele pe care le folosesc, vom sublinia, de asemenea, pe scurt principiile de bază ale proiectării magistralelor În secțiunile următoare, vom descrie în detaliu exemple de procesoare și magistrale pentru acestea Chip-uri și magistrale de procesor Chip-uri de procesor Toate procesoarele moderne se potrivesc pe un singur cip Acest lucru face ca mecanismul interacțiunii lor cu restul sistemului să fie destul de clar Fiecare cip de procesor conține un set de pini prin care se face schimb de informații cu lumea exterioară Unii pini transmit semnale de la CPU, alții primesc semnale de la alte componente, iar alții fac ambele Examinând funcțiile tuturor pinii, putem afla cum interacționează procesorul cu dispozitivele de memorie și I/O la nivel logic digital Concluziile microcircuitului procesorului central pot fi împărțite în trei tipuri: adresă, informații și control Acești pini sunt conectați la pinii corespunzători de pe cipurile de memorie și cipurile dispozitivului I/O printr-un set de fire paralele (numite magistrală) Pentru a apela o comandă, CPU trimite mai întâi adresa acelei comenzi în memorie pe pinii adresei Apoi folosește una sau mai multe linii de control pentru a spune memoriei că are nevoie pentru a citi un cuvânt, de exemplu Memoria răspunde plasând cuvântul necesar pe pinii de informații ale procesorului și semnalând că a fost făcut Când CPU primește acest semnal, citește cuvântul și execută instrucțiunea apelată Comanda poate necesita citirea sau scrierea cuvintelor care conțin date În acest caz, întregul proces se repetă pentru fiecare cuvânt suplimentar Cum se întâmplă procesul de citire și scriere, vom analiza în detaliu mai târziu Între timp, este important să înțelegeți că procesorul comunică cu dispozitivele de memorie și I/O trimițând semnale către pini și primind semnale către intrări Nu există altă modalitate de a face schimb de informații Numărul de pini de adresă și numărul de pini de informații sunt doi parametri cheie care determină performanța unui procesor Un microcircuit care conține m pini de adresă poate accesa m celule de memorie De obicei, m este , , sau Un cip care conține n pini de informații poate citi sau scrie un cuvânt r-bit într-o singură operație De obicei, n este , , , sau Un CPU cu pini de date va avea nevoie de operații pentru a citi un cuvânt de de biți, în timp ce un CPU cu de pini de date poate face aceeași sarcină într-o singură operațiune Prin urmare, un cip cu de pini de informații este mult mai rapid, dar și mult mai scump Pe lângă ieșirile de adresă și informații, fiecare procesor conține ieșiri de control Acești pini vă permit să reglați și să sincronizați fluxul de date către și de la procesor și să efectuați alte funcții Toate procesoarele conțin pini pentru alimentare (de obicei + , V sau + V), masă și ceas (pătrat) Restul pinii variază de la procesor la procesor Cu toate acestea, concluziile de control pot fi împărțite în mai multe categorii principale: ♦ management autobuz; ♦ întrerupe; + arbitraj autobuz; Capitolul Nivel logic digital ♦ semnale coprocesor; + stare; ♦ diverse În cele ce urmează, vom descrie pe scurt fiecare dintre aceste categorii, iar când ne uităm la cipurile Pentium , UltraSPARC III și , vom oferi informații mai detaliate O schemă a unui CPU tipic care utilizează aceste tipuri de semnale este prezentată în Fig Adresarea Date Gestionarea autobuzelor întreruperi Autobuz Arbitraj Coprocesor Stat Alte Semnale Simbol Ф + V împământare Caracter XI Tensiune de sincronizare semnal V Orez Pinout-ul unui procesor tipic Săgețile indică semnalele de intrare și de ieșire Liniile diagonale scurte indică prezența mai multor cabluri de acest tip Numărul acestor pini depinde de modelul procesorului Pinii de control al magistralei sunt în cea mai mare parte ieșirile de la CPU către magistrală (și, prin urmare, intrările către cipurile de memorie și cipurile I/O) Acestea vă permit să indicați că procesorul dorește să citească informații din memorie sau să scrie informații în memorie sau să facă altceva Pinii de întrerupere sunt intrări de la dispozitivele I/O către procesor În majoritatea sistemelor, procesorul poate semnala unui dispozitiv I/O să înceapă o operație și apoi să facă altceva în timp ce dispozitivul I/O își face treaba Când dispozitivul I/O îl termină, controlerul I/O trimite un semnal către unul dintre pinii de întrerupere pentru a întrerupe procesorul și a-l forța să întrețină dispozitivul I/O (de exemplu, verificați erorile I/O) Unele procesoare includ un pin de ieșire conceput pentru a confirma primirea unui semnal de întrerupere Pinii de arbitraj de magistrală sunt necesari pentru a regla fluxul de informații pe magistrală, adică pentru a preveni astfel de situații când două dispozitive încearcă să folosească magistrala în același timp În ceea ce privește arbitrajul, procesorul este considerat a fi doar unul dintre dispozitive Unele procesoare pot funcționa cu co-procesoare diferite (de exemplu, GPU-uri, procesoare pentru procesare Chip-uri și magistrale de procesor valori în virgulă mobilă etc ) Pentru a asigura schimbul de informații între procesor și coprocesor, se folosesc pini speciali Pe lângă acești pini, unele procesoare au pini suplimentari Unele dintre ele emit sau primesc informații de stare, altele sunt necesare pentru a reporni computerul, iar altele sunt concepute pentru a asigura compatibilitatea cu cipurile dispozitivelor I/O mai vechi Anvelope pentru computer O magistrală este un set de fire care conectează diferite dispozitive Anvelopele pot fi clasificate în funcție de funcția lor Acestea pot fi interne procesorului și servesc la transferul de date către și de la ALU, sau pot fi externe procesorului și pot conecta procesorul la memorie sau la dispozitive I/O Fiecare tip de anvelopă are anumite proprietăți, iar fiecare dintre ele are anumite cerințe În aceasta și în următoarele subsecțiuni, ne vom concentra asupra magistralelor care conectează CPU la memorie și dispozitivele I/O În capitolul următor, vom arunca o privire mai atentă asupra magistralelor interne ale procesorului Primele computere personale aveau o singură magistrală externă, numită magistrală de sistem Acesta a constat din mai multe fire de cupru (de la la ) care au fost încorporate în placa de bază Pe placa de bază, la distanțe egale unul de celălalt, existau conectori pentru cipuri de memorie și dispozitive de intrare-ieșire Calculatoarele personale moderne conțin de obicei o magistrală dedicată între CPU și memorie și cel puțin o altă magistrală pentru dispozitivele I/O Pe fig Figura prezintă un sistem cu o magistrală de memorie și o magistrală I/O În literatură, anvelopele sunt de obicei descrise ca săgeți îndrăznețe, așa cum se arată în această figură Diferența dintre săgeata aldină și săgeata fără aldine, Capitolul Nivel logic digital prin care trece o linie diagonală scurtă care indică numărul de biți, mic Când tipul tuturor biților este același, de exemplu, toți biții de adresă sau toți biții de date, este desenată o săgeată obișnuită Când adresa, datele și liniile de control sunt activate, se folosește o săgeată aldine În timp ce proiectanții de procesoare pot folosi orice tip de magistrală pentru un cip, trebuie aplicate reguli clare despre modul în care funcționează magistrala; și toate dispozitivele conectate la magistrală trebuie să respecte aceste reguli, astfel încât plăcile de la terți să se potrivească magistralei de sistem Aceste reguli se numesc protocol de magistrală În plus, trebuie să existe anumite cerințe tehnice pentru ca plăcile de la terți să se potrivească în șinele PCB și să aibă conectori care se potrivesc mecanic cu placa de bază în ceea ce privește tensiunile, sincronizarea etc Există o serie de autobuze utilizate pe scară largă în lumea computerelor, de exemplu: Omnibus (PDP- ), Unibus (PDP- ), Multibus ( ), IBM PC (PC/XT), ISA (PC/AT), EISA ( ), Microchannel (PC/ ), PCI (diverse computere personale), SCSI (diverse computere personale și stații de lucru), Nubus (Macintosh), Universal Serial Bus (calculatoare personale moderne), FireWire (electronice de larg consum), VME ( echipamentul clasei de fizică) și Satae (fizica înaltelor energii) Poate că lucrurile ar fi mult mai ușor dacă toate cauciucurile, cu excepția uneia sau două, ar dispărea de pe suprafața pământului Din păcate, standardizarea în acest domeniu pare foarte puțin probabilă, deoarece deja au fost investiți prea mulți bani în toate aceste sisteme incompatibile Să începem cu modul în care funcționează anvelopele Unele dispozitive conectate la magistrală sunt active și pot iniția comunicarea pe magistrală, în timp ce altele sunt pasive și așteaptă cereri Dispozitivul activ se numește master, dispozitivul pasiv se numește slave Când CPU solicită controlerului de disc să citească sau să scrie un bloc de informații, CPU acționează ca master și controlerul de disc acționează ca slave Controlerul de disc poate acționa ca un master atunci când spune memoriei să accepte cuvintele pe care le-a citit de pe disc Câteva combinații tipice master și slave sunt enumerate în Tabelul Memoria în niciun caz nu poate fi un dispozitiv principal Tabelul Exemple de maestru și sclav Dispozitiv master Dispozitiv slave Exemplu CPU Memory Apelarea comenzilor și a datelor Dispozitiv I/O CPU Inițializează transferul de date Unitate centrală de procesare Coprocesor Trimiterea unei comenzi de la procesor la coprocesor Dispozitiv I/O Memorie DMA CPU coprocesor Coprocesorul apelează operanzi de la CPU Chip-uri și magistrale de procesor Semnalele binare produse de dispozitivele computerizate nu sunt adesea suficient de puternice pentru a activa magistrala, mai ales dacă este suficient de lungă și dacă la el sunt conectate multe dispozitive Din acest motiv, majoritatea driverelor de autobuz sunt de obicei conectate la magistral printr-un cip numit driver de magistrală, care este în esență un amplificator binar În mod similar, majoritatea dispozitivelor slave sunt conectate la magistrală printr-o chiuvetă de magistrală Pentru dispozitivele care pot fi atât master cât și slave, se folosește un transceiver magistrală sau transceiver Aceste cipuri, concepute pentru a interacționa cu autobuzul, sunt adesea dispozitive cu trei stări, oferindu-le posibilitatea de a se detașa atunci când nu sunt necesare Uneori sunt conectate printr-un colector deschis, ceea ce dă un efect similar Când unul sau mai multe dispozitive colectoare deschise solicită accesul la magistrală în același timp, rezultatul este o operație booleană OR pe toate aceste semnale Un astfel de acord se numește SAU de montaj Pe majoritatea autobuzelor, unele linii sunt dispozitive tri-state, iar altele care necesită o proprietate cu fir SAU sunt open-collector Ca și procesorul, magistrala are linii de adresă, date și control Cu toate acestea, este posibil să nu existe o corespondență unu-la-unu între pinii procesorului și semnalele magistralei De exemplu, unele procesoare au trei pini care oferă un semnal de citit sau de scris în memorie, de citit de pe un dispozitiv I/O, de a scrie pe un dispozitiv de I/O sau de a efectua o altă operațiune O magistrală obișnuită poate conține o linie pentru citirea din memorie, o a doua pentru scrierea în memorie, o a treia pentru citirea de la un dispozitiv I/O, o a patra pentru scrierea pe un dispozitiv I/O etc Atunci cipul trebuie să conecteze procesorul la o astfel de magistrală - un decodor conceput pentru a converti un semnal codat pe biți în semnale separate care pot conduce linii de magistrală Dezvoltarea anvelopelor și principiile de funcționare a anvelopelor sunt probleme destul de complexe, iar pe acest subiect au fost scrise o serie de cărți [I, ] Principalele probleme de proiectare sunt lățimea autobuzului, sincronizarea autobuzului, arbitrarea autobuzului și performanța autobuzului Toți acești parametri afectează semnificativ debitul magistralei În următoarele patru subsecțiuni, ne vom uita la fiecare dintre ele Latimea anvelopei Lățimea magistralei (numărul de linii de adresă) este cel mai evident parametru de proiectare Cu cât magistrala conține mai multe linii de adresă, cu atât mai multă memorie poate accesa procesorul Dacă magistrala conține n linii de adresă, atunci procesorul o poate folosi pentru a adresa locații de memorie diferite de " Memoria de capacitate mare necesită multe linii de adresă Asta sună destul de simplu Problema este că anvelopele late necesită mai multe fire decât cele înguste Ocupă mai mult spațiu fizic (de ex pe placa de bază) și necesită conectori mai mari Toate acestea Capitolul Nivel logic digital Factorii fac ca anvelopa să fie costisitoare Prin urmare, trebuie făcut un compromis între cantitatea maximă de memorie disponibilă și costul sistemului Un sistem cu o magistrală care conține de linii de adresă și de octeți de memorie va costa mai mult decât un sistem cu o magistrală care conține de linii de adresă și aceiași de octeți de memorie Extinderea ulterioară nu este gratuită Mulți designeri de sisteme au fost miopi, s-au inversat Primul model de PC IBM conținea procesorul și o magistrală de adrese de de biți (Fig , a) Autobuzul a permis accesul la MB de memorie adresa pe de biți Control adresa pe biți Control adresa pe de biți Control adresa pe biți Control adresa pe biți Control b V Orez Extinderea magistralei de adrese în timp Când a sosit următorul procesor ( ), Intel a decis să mărească spațiul de adrese la MB, așa că au trebuit adăugate încă benzi (păstrând cele inițiale din motive de compatibilitate inversă), așa cum se arată în Figura b Din păcate, au trebuit adăugate și linii de control pentru noile linii de adresă Când a apărut procesorul , s-au adăugat încă linii de adresă și, bineînțeles, mai multe linii de control, așa cum se arată în fig , c Rezultatul este un autobuz EISA Cu toate acestea, ar fi mai bine dacă ar exista de linii de la bun început În timp, nu doar numărul liniilor de adresă crește, ci și numărul liniilor de informații, deși acest lucru se întâmplă dintr-un motiv diferit Există două moduri de a crește lățimea de bandă a magistralei: reduceți timpul ciclului magistralei (efectuați mai multe transferuri pe secundă) sau măriți lățimea magistralei de date (adică creșteți numărul de biți transferați pe ciclu) Este posibil să creșteți viteza autobuzului, dar este destul de dificil să faceți acest lucru, deoarece semnalele pe diferite linii sunt transmise la viteze diferite (acest fenomen se numește declin de magistrală) Cu cât rulează mai repede anvelopa, cu atât este mai înclinată Pe măsură ce viteza autobuzului crește, apare o altă problemă: în acest caz, acesta devine incompatibil cu versiunile anterioare Plăcile vechi concepute pentru un autobuz mai lent nu pot funcționa cu cel nou Un astfel de si Chip-uri și magistrale de procesor Această opțiune este neprofitabilă pentru proprietarii și producătorii de plăci vechi Prin urmare, este obișnuit să adăugați pur și simplu linii noi pentru a crește productivitatea, așa cum se arată în Fig După cum vă puteți imagina, acest lucru are și dezavantajele sale IBM PC și succesorii săi, de exemplu, au început cu linii de date, apoi au trecut la , apoi la de linii, toate pe aceeași magistrală Pentru a rezolva această problemă, dezvoltatorii preferă uneori magistrala multiplex În acest autobuz nu există o împărțire în linii de adresă și informații Poate avea, de exemplu, de linii atât pentru adrese, cât și pentru date Aceste linii sunt folosite mai întâi pentru adrese, apoi pentru date Pentru a scrie informații în memorie, trebuie mai întâi să transferați adresa în memorie, apoi datele În cazul liniilor separate, adresele și datele pot fi transmise împreună Îmbinarea liniilor reduce lățimea și costul autobuzului, dar sistemul este mai lent Prin urmare, dezvoltatorii trebuie să cântărească argumentele pro și contra înainte de a face o alegere Ora autobuzului Anvelopele pot fi împărțite în două categorii în funcție de momentul lor Autobuzul sincron conține o linie care este condusă de un oscilator cu cristal Semnalul pe această linie este o undă pătrată cu o frecvență de obicei de la la MHz Orice acțiune de magistrală necesită un număr întreg de așa-numitele cicluri de magistrală Magistrala asincronă nu conține un oscilator principal Ciclurile magistralei pot fi arbitrare și nu sunt neapărat aceleași pentru toate perechile de dispozitive În continuare, vom lua în considerare fiecare tip de anvelopă separat Anvelope sincrone Ca exemplu al modului în care funcționează o magistrală asincronă, luați în considerare diagrama de timp din Fig În acest exemplu, vom folosi un oscilator principal de MHz, care oferă un ciclu de magistrală de ns Deși poate părea că magistrala este lentă în comparație cu procesoarele de GHz și mai mari, nu multe autobuze moderne sunt mai rapide De exemplu, populara magistrală PCI rulează la MHz sau MHz Motivele pentru o viteză atât de scăzută a anvelopelor moderne au fost deja discutate: probleme tehnice precum deformarea anvelopelor și nevoia de compatibilitate pot fi atribuite acestora În exemplul nostru, presupunem că citirea informațiilor din memorie durează ns din momentul în care adresa este setată După cum vom vedea în curând, este nevoie de trei cicluri de autobuz pentru a citi un cuvânt Primul ciclu începe în partea din față a segmentului Tt, iar al treilea se termină în partea din față a segmentului T , așa cum se arată în fig Rețineți că niciuna dintre creșteri și căderi nu sunt desenate vertical, deoarece niciun semnal electric nu își poate schimba valoarea în timp zero În exemplul nostru, presupunem că este nevoie de ns pentru ca semnalul să se schimbe Generatorul și liniile de adresă și date, precum și liniile MREQ, RD, WAIT sunt afișate pe aceeași scară de timp Pornirea este determinată de partea din față a generatorului În timp, CPU plasează adresa cuvântului dorit pe liniile de adresă Deoarece o adresă nu este o singură valoare (spre deosebire de un generator), nu putem Capitolul Nivel logic digital arătați-l ca o singură linie pe diagramă În schimb, am arătat-o ca două linii cu intersecții în care această adresă se schimbă Culoarea gri de pe diagramă arată că în acest moment nu contează ce valoare a luat semnalul Folosind aceeași convenție, vedem că conținutul liniilor de date nu contează până la segmentul T Orez Diagrama de timp a procesului de citire pe magistrala sincronă După ce liniile de adresă au posibilitatea de a dobândi o nouă valoare, semnalele MREQ și RD sunt setate Primul indică faptul că se accesează memoria și nu dispozitivul I/O, iar al doilea indică faptul că citirea este în curs, nu scrierea Deoarece este nevoie de ns (parte a primului ciclu) pentru a citi informațiile din memorie după setarea adresei, memoria nu poate transfera datele necesare în perioada T Pentru a împiedica CPU să aștepte sosirea datelor, memoria setează semnalul WAIT la începutul segmentului T Aceasta înseamnă introducerea unor perioade de așteptare (cicluri suplimentare de magistrală) până când memoria resetează semnalul WAIT În exemplul nostru, este introdusă o perioadă de așteptare (T ), deoarece memoria este prea lentă La începutul segmentului T , când există încredere că memoria va primi date în timpul ciclului curent, semnalul WAIT este resetat În prima jumătate a T , memoria plasează date pe liniile de date La declinul segmentului T , procesorul central strobocizează (adică citește) liniile de informații, stocând valorile acestora în registrul intern După citirea datelor, procesorul resetează semnalele MREQ și RD Dacă este necesar, un alt ciclu de memorie poate începe pe următorul front Această secvență poate fi repetată la infinit Chip-uri și magistrale de procesor În continuare, se clarifică semnificația a opt simboluri din diagrama de timp (vezi Fig ) - acestea sunt enumerate în tabel TAD, de exemplu, este intervalul de timp dintre creșterea și setarea liniilor de adresă Conform cerințelor de sincronizare TAD ' F Sursă energie Orez Pinout-ul procesorului Pentium Denumirile oficiale ale semnalelor individuale sunt date cu majuscule; nume general acceptate ale grupurilor de semnale înrudite și descrieri ale semnalelor - litere mici CPU sau alt master de magistrală poate emite o cerere de acces la magistrală folosind următorul grup de semnale Adresele au de biți, dar ultimii trei biți trebuie să fie întotdeauna și, prin urmare, nu au pini proprii, deci grupul A# are doar de pini Toate transmisiile constau din octeți Deoarece adresa conține de biți, memoria maximă este de , adică GB Când o adresă este trimisă către magistrală, semnalul ADS# este setat Acest semnal informează ținta (de exemplu, memoria) despre valabilitatea liniilor de adresă Liniile REQ# încep un ciclu de magistrală de un anumit tip (de exemplu, citirea unui cuvânt sau scrierea unui bloc) Sunt necesare două semnale de paritate pentru a verifica A# și REQ# Cinci linii speciale transmit mesaje de eroare în operațiuni cu virgulă mobilă, interne, mașini (hardware) și alte erori Capitolul Nivel logic digital Semnalele de răspuns sunt transmise de la slave la master Semnalul RS# conține un cod de stare Semnalul TRDY# indică faptul că slave (țintă) este pregătit să primească date de la master Aceste semnale sunt verificate de paritate În cazul în care ținta nu răspunde la timp, se stabilește o așteptare cu semnalul BNR# Ultimul grup de semnale este necesar pentru transmiterea datelor Semnalul D# permite trimiterea a octeți de date către magistrală Când datele intră în magistrală, este emis semnalul DRDY# (semnal de date pe magistrală) Le spune dispozitivelor că magistrala este ocupată în prezent Verificarea parității se aplică și aici Unele semnale sunt responsabile pentru blocarea și alte operațiuni de date Semnalul RESET# este necesar pentru a reporni procesorul în cazul unei defecțiuni sau când utilizatorul apasă butonul de resetare de pe panoul frontal al unității de sistem Pentium poate implementa întreruperi în același mod ca și (necesar din motive de compatibilitate) sau poate utiliza noul sistem de întrerupere cu dispozitivul Advanced Programmable Interrupt Controller (APIC) Pentium poate funcționa la oricare dintre mai multe tensiuni prestabilite, dar procesorul trebuie să știe la ce tensiune va funcționa Semnalele de gestionare a puterii sunt utilizate pentru a selecta automat tensiunea de alimentare, pentru a notifica procesorului despre stabilitatea puterii și pentru o serie de alte operațiuni conexe Cu ajutorul lor, se realizează tranziția la diferite stări de somn, care, desigur, sunt unul dintre instrumentele de gestionare a energiei În ciuda mecanismului sofisticat de gestionare a energiei, Pentium poate atinge temperaturi foarte ridicate Un grup de semnale de control al temperaturii permite procesorului să alerteze dispozitivele din jur despre pericolul supraîncălzirii Aceasta include, de exemplu, un semnal dat de CPU atunci când temperatura sa internă depășește °C ( °F) Deși dacă temperatura procesorului depășește °C, probabil că deja visează la pensie și la un serviciu conștiincios ca încălzitor Grupul de semnal de ceas este responsabil pentru determinarea frecvenței magistralei sistemului Grupul de semnale de diagnosticare este destinat testării și depanării sistemelor conform standardului IEEE JTAG Grupul de semnale de inițializare servește la încărcarea (pornirea) sistemului În cele din urmă, există un grup de semnale diverse, printre care, printre altele, există un semnal care indică faptul că soclul CPU este ocupat, un semnal care servește modul de emulare și altele Conducerea magistralei de memorie a procesorului Pentium Procesoarele moderne, cum ar fi Pentium , sunt mult mai rapide decât RAM dinamică de astăzi Pentru ca procesorul să nu funcționeze, este necesară cea mai mare performanță posibilă a memoriei Din acest motiv, magistrala de memorie a procesorului Pentium funcționează în modul pipeline, cu operațiuni care au loc simultan pe magistrală Am luat în considerare conceptul de transportor Exemple de procesoare în capitolul când am vorbit despre procesoare pipeline Rețineți că memoria poate fi, de asemenea, canalizată Accesul procesorului la memorie, care se numește tranzacții, consta în șase faze: Arbitraj autobuz Cerere Mesaj de eroare Urmărire Răspunde Transfer de date Toate cele șase faze sunt opționale Faza de arbitraj cu autobuzul determină care șofer va fi următorul În faza de solicitare, o adresă este trimisă către autobuz În timpul fazei de raportare a erorilor, slave trimite un semnal că există o eroare de paritate în adresă sau o altă problemă În faza de urmărire, CPU verifică dacă cuvântul de care are nevoie se află în memoria cache a altui CPU Această fază este necesară doar pe sistemele multiprocesor În următoarea fază, șoferul va ști de unde să obțină datele necesare Ultima fază este transferul de date Într-un sistem cu procesor Pentium , fiecare fază folosește anumite semnale care sunt diferite de semnalele altor faze, deci fiecare dintre ele este independentă de celelalte Șase grupuri din aceste semnale sunt prezentate în partea stângă a fig De exemplu, unul dintre procesoare poate încerca să obțină acces la magistrală folosind semnale de arbitrare De îndată ce procesorul obține acces la magistrală, eliberează aceste linii de magistrală și captează liniile de solicitare Între timp, un alt procesor sau un dispozitiv I/O poate intra în faza de arbitrare a magistralei, și așa mai departe Figura ilustrează situația în care tranzacțiile multiple sunt executate în același timp Faza de arbitraj autobuz din fig nu este afișat deoarece nu este întotdeauna necesar De exemplu, dacă dispozitivul care deține în prezent magistrala (adesea CPU-ul) dorește să facă o altă tranzacție, nu trebuie să acceseze din nou magistrala Trebuie să solicitați din nou autobuzul doar dacă acesta l-a cedat altui dispozitiv Tranzacțiile și sunt normale: cinci faze pe cinci cicluri de magistrală În timpul tranzacției , este introdusă o fază mai lungă de transfer de date (când, de exemplu, trebuie transferat un întreg bloc sau este intrat într-un mod de așteptare) Ca urmare, tranzacția nu poate începe faza de transfer de date imediat după faza de răspuns Faza de transfer de date nu începe până când semnalul DBSY# nu este șters Faza de răspuns din tranzacția poate dura, de asemenea, mai multe cicluri de magistrală, ceea ce întârzie tranzacția În cele din urmă, vedem că tranzacția experimentează și o întârziere În realitate, este puțin probabil ca CPU să încerce să înceapă o nouă tranzacție la fiecare ciclu de magistrală, așa că timpii de inactivitate nu sunt atât de lungi În partea stângă a figurii sunt afișate doar grupuri Semnalele unei alte faze (faza de urmărire) din anumite motive au ajuns în partea dreaptă a figurii - Notă ed Orez Conducerea magistralei de memorie pe un sistem cu procesor Pentium Capitolul Nivel logic digital Exemple de procesoare UltraSPARC III Ca un al doilea exemplu de procesor, să luăm familia UltraSPARC (produsă de Sun) Familia UltraSPARC este o linie de procesoare SPARC pe de biți Aceste procesoare sunt pe deplin compatibile cu arhitectura SPARC versiunea , tot pe de biți Sunt utilizate în stațiile de lucru și serverele Sun și în multe alte sisteme Familia include procesoarele UltraSPARC I, UltraSPARC II și UltraSPARC III, care au o arhitectură similară, dar diferă în ceea ce privește data lansării și viteza de ceas Vom vorbi despre procesorul UltraSPARC III în cele ce urmează, deoarece avem nevoie de un exemplu specific, dar caracteristicile arhitecturale (adică, independente de implementare) sunt în cea mai mare parte valabile pentru alte tipuri UltraSPARC UltraSPARC III este un motor tradițional RISC Este pe deplin compatibil cu procesorul SPARC V pe de biți Singura diferență dintre UltraSPARC III și SPARC V este suportul pentru comenzile VIS , care sunt concepute pentru aplicații de grafică D, decodare MPEG în timp real, compresie de date, procesare a semnalului, execuție a programelor Java și rețea Procesorul UltraSPARC III este adesea instalat în stațiile de lucru, dar a fost proiectat inițial pentru servere multiprocesoare cu memorie partajată utilizate pe Internet și rețelele corporative Cu alte cuvinte, fiecare cip UltraSPARC III include elementele de conectare necesare pentru a construi un multiprocesor Primul UltraSPARC III, introdus în , rula la MHz și avea șiruri de , µm pe bază de aluminiu Cipurile conțineau de milioane de tranzistori Sun nu are propria sa unitate de producție a procesoarelor care să îndeplinească cele mai recente cerințe de tehnologie, așa că folosește contractori direcți de producție pentru a se concentra pe proiectarea cipurilor și dezvoltarea de software În cazul UltraSPARC III, acest contractant este Texas Instruments (TI) În , după modernizarea bazei tehnologice a TI, a început producția de microcircuite cu o frecvență de ceas de MHz și o lățime de linie de , microni; totodată, conductoarele de aluminiu au fost înlocuite cu altele de cupru Până în , lățimea liniei a fost redusă la , µm, iar viteza de ceas a crescut la , GHz Toate aceste cipuri necesită o putere de intrare de W, așa că problemele de disipare a căldurii sunt la fel de relevante pentru ele ca și pentru Pentium Cipurile CISC (cum ar fi Pentium ) și cipurile RISC (cum ar fi UltraSPARC III) nu sunt comparabile doar pe baza vitezei de ceas Să presupunem că procesorul UltraSPARC este capabil să ruleze patru instrucțiuni pe ciclu, ceea ce înseamnă că viteza sa de execuție este aproape aceeași cu cea a unui procesor care rulează la , GHz, dar capabil să execute doar o instrucțiune pe ciclu În plus, UltraSPARC are șase conducte interne, dintre care două sunt de etape fiecare pentru operațiuni întregi, două pentru operațiuni cu virgulă mobilă, una pentru operațiuni de încărcare/stocare și una pentru ramificare În plus, UltraSPARC implementează tehnologia originală de cache, există mai largi Capitolul Nivel logic digital anvelope, ca să nu mai vorbim de alți factori de îmbunătățire a performanței Pentium are, de asemenea, avantajele sale, adică compararea a două microcircuite complet diferite pe baza frecvențelor lor de ceas nu oferă rezultate precise în legătură cu o anumită sarcină Cipul UltraSPARC III conține de pini într-un pachet LGA (Land Grid Array), așa cum se arată în fig Pinii sunt situati in partea de jos a cipului sub forma unei matrice patrate de x (total ), careia ii lipseste un pin in coltul din stanga jos Conectorul corespunde pe deplin cu locația pinii de pe microcircuit, ceea ce elimină posibilitatea instalării incorecte Orez Cip de procesor UltraSPARC III Procesorul UltraSPARC III conține cache interne L : KB pentru instrucțiuni și KB pentru date În plus, sunt furnizate un cache de preluare prealabilă de KB și un cache de scriere de aceeași capacitate; acesta din urmă acumulează operațiuni de scriere și le transferă în cache-ul de al doilea nivel în blocuri mari, optimizând astfel consumul de lățime de bandă La fel ca Pentium , cache-ul L este off-chip, dar spre deosebire de Pentium , procesorul UltraSPARC III nu este împachetat cu cache-ul L (separat de controlerul de cache și de logica de detectare a blocurilor de cache) ), astfel încât dezvoltatorii au dreptul pentru a alege orice chips-uri pentru a implementa acestea din urmă Decizia de a combina memoria cache L cu procesorul (ca la Pentium ) sau de a o împărți cu procesorul (ca și la UltraSPARC III) este condusă de o alegere între diferite avantaje tehnice, precum și caracteristici de la Intel și Sun Cache-ul extern este mai mare și mai flexibil (cache-ul procesorului UltraSPARC III variază de la la MB; cache-ul procesorului Pentium este fixat la KB), dar este mai lent datorită locației sale mai departe de procesor Sunt necesare mai multe semnale pentru a accesa memoria cache externă În special, de biți sunt alocați pentru conexiunea dintre cache-urile UltraSPARC III și L , ceea ce înseamnă că această conexiune permite ca un bloc de date cache de de octeți să fie transferat într-un ciclu Exemple de procesoare În ceea ce privește caracteristicile de producție, Intel este un producător de semiconductori, așa că are capacitatea de a proiecta și produce propriile cipuri cache L și de a comunica cu procesorul prin propria interfață de înaltă performanță Sun, dimpotrivă, este un producător de computere, nu de cipuri Uneori își proiectează propriile cipuri (cum ar fi UltraSPARC III), dar externalizează producția acestora către producătorii de semiconductori În principiu, Sun folosește cipuri disponibile în comerț RAM statică L cache este disponibilă de la diverși furnizori, așa că nu era nevoie ca Sun să-și dezvolte propria RAM Și dacă memoria RAM nu este special concepută, atunci trebuie să instalați memoria cache de nivel al doilea separat de procesorul central Pentru a conecta procesoarele UltraSPARC III la modulele de memorie, Sun a dezvoltat o interfață UPA (Ultra Port Architecture) de mare viteză UPA poate fi implementat ca o magistrală, un comutator sau o combinație a ambelor Diferitele stații de lucru și servere utilizează diferite implementări UPA Implementarea UPA nu depinde în niciun fel de procesor, deoarece interfața UPA este definită cu precizie, iar procesorul trebuie (și face) să suporte această interfață Pe fig vedem nucleul sistemului UltraSPARC III: procesorul central, interfața UPA și cache-ul de al doilea nivel ( RAM statice) În figura se prezintă și cipul UDB II (UltraSPARC Data Buffer II), ale cărui funcții le vom discuta mai jos Când procesorul are nevoie de un cuvânt din memorie, mai întâi accesează memoria cache de primul nivel Dacă găsește un cuvânt, continuă să efectueze operațiuni la viteză maximă Dacă nu găsește cuvântul în memoria cache de primul nivel, trece în memoria cache de al doilea nivel Deși vom discuta despre funcționarea memoriei cache în detaliu în Capitolul , merită totuși să spunem câteva cuvinte despre aceasta aici Toată memoria principală este subdivizată în linii cache (blocuri) de de octeți Cache-ul L conține cele de linii de instrucțiuni cele mai utilizate și cele de linii de date cele mai utilizate Cache-ul L conține linii care nu s-ar încadra în memoria cache L Cache-ul de al doilea nivel conține linii de date și comenzi intercalate Ele sunt stocate în RAM statică, care în Fig este indicat printr-un bloc cu inscripția "Memoria cache de date de al doilea nivel" Sistemul trebuie să urmărească ce linii se află în memoria cache L Aceste informații sunt stocate în a doua RAM statică, prezentată în Fig ca "etichete cache de nivel " În absența liniei dorite în cache-ul de primul nivel, CPU trimite identificatorul liniei pe care o caută (adresa etichetei) către cache-ul de al doilea nivel Răspunsul (date de etichetă) oferă CPU-ului informații despre dacă linia dorită se află în memoria cache L Dacă există o linie, procesorul o primește Datele sunt transferate în trepte de octeți, deci este nevoie de cicluri pentru a transfera o linie întreagă în memoria cache L Capitolul Nivel logic digital Orez Structura de bază a sistemului UltraSPARC III Dacă linia necesară nu se află în cache-ul de al doilea nivel, trebuie apelată din memoria principală prin interfața UPA UPA într-un sistem UltraSPARC III este implementat de un controler centralizat Semnalele de adresă și semnalele de control de la procesorul central (sau procesoarele, dacă sunt mai multe) ajung acolo Pentru a accesa memorie, CPU trebuie mai întâi să aibă permisiunea de a utiliza magistrala Când magistrala este acordată unui procesor, acesta primește un semnal de la pinii de adresă, determină tipul de solicitare și trece semnalul pe pinul de adresă dorit (acești pini sunt bidirecționali deoarece alte procesoare dintr-un sistem UltraSPARC III trebuie să acceseze la distanță) blocuri cache) Adresa și tipul ciclului magistralei sunt transferate la pinii de adresă în două cicluri, primul ciclu producând un rând și al doilea ciclu producând o coloană, așa cum am discutat în discuția din Fig În timp ce așteptați rezultatele, procesorul poate face alte lucrări De exemplu, absența instrucțiunii dorite în cache nu împiedică executarea uneia sau mai multor instrucțiuni care sunt deja apelate și fiecare dintre ele poate accesa date care nu se află în cache Astfel, mai multe tranzacții UPA pot fi în așteptare simultan UPA poate gestiona două fluxuri independente de tranzacții (de obicei o citire și una de scriere), fiecare flux rulând cu câteva întârzieri Sarcina controlerului centralizat este să țină evidența tuturor acestor lucruri și să facă accesări la memorie în cea mai rațională ordine Datele din memorie vin în blocuri de octeți Pentru o mai mare fiabilitate, acestea conțin un cod de corectare a erorilor pe biți Puteți solicita întregul bloc cache ( octeți) sau chiar mai puțin Toate intrările vin Exemple de procesoare în tamponul UDB și stocat acolo Bufferul UDB este necesar pentru a permite procesorului și memoriei să funcționeze asincron De exemplu, dacă CPU trebuie să scrie un cuvânt sau o linie cache în memoria principală, este posibil să nu aștepte un acces UPA, ci să scrie datele imediat într-un buffer UDB, care le va livra mai târziu în memorie UDB generează, de asemenea, un cod de corectare a erorilor Rețineți că descrierea procesoarelor UltraSPARC III și Pentium din această carte este foarte simplificată Cu toate acestea, esența muncii lor a fost reușită Pentium și UltraSPARC III sunt procesoare de înaltă performanță concepute pentru computere personale și stații de lucru de înaltă performanță Cu toate acestea, există și alte computere - așa-numitele sisteme încorporate Acestea sunt pe care le vom lua în considerare aici folosind exemplul procesorului Nu este exagerat să spunem că practic orice dispozitiv electronic care valorează mai mult de USD conține un computer încorporat Televizoarele, telefoanele mobile, secretarele electronice, cuptoarele cu microunde, camerele video, aparatele video, imprimantele laser, sistemele de alarmă împotriva intrușilor, aparatele auditive, jocurile electronice și multe alte dispozitive (lista este nesfârșită) sunt controlate de un computer În acest caz, se pune accent nu pe performanța ridicată, ci pe costul redus al unui computer încorporat, ceea ce duce la un echilibru ușor diferit de avantaje și dezavantaje față de procesoarele despre care am discutat până acum Am menționat în capitolul că este în prezent cel mai obișnuit microcontroler O astfel de popularitate se datorează în primul rând costului său scăzut După cum vom vedea mai târziu, este un cip mic la care este foarte ușor să conectați alte dispozitive Structura sa fizică este prezentată în Fig R SGY P C P E: C P C P C P C P C P C RSTC r VSS RXD / R C THR/ R S INT / P I INT / RZ Z C TO / R S T / P WRZ P C RD / Р С ZI RO O / AD ZJ ROL ZAD ZI P / AD ZI RO / AD =□ P ZAD ZJ P / AD P / AD P / AD Z EA/VPP =] ALE PSEN XTAL C XTAL De la VSSO ZJ P /A ZJP /A I P /A Р /А ZI P / A I P /A Р /А J R / A Orez Aspectul fizic al cipului Capitolul Nivel logic digital După cum puteți vedea în această diagramă, este de obicei furnizat într-un pachet standard cu de pini (deși alte pachete sunt disponibile pentru aplicații specifice) Acest cip are linii de adresă, limita de adrese de memorie este de KB Lățimea magistralei de date este de biți, ceea ce înseamnă că schimbul de date între CPU și memorie se realizează în blocuri de un octet (în Pentium această cifră este de octeți, în UltraSPARC III - octeți) Există mai multe opțiuni pentru liniile de control (sunt descrise mai jos), dar diferența cea mai evidentă față de Pentium și UltraSPARC, care sunt procesoare dedicate, este prezența a de linii I/O în patru grupuri ( biți fiecare) Fiecare dintre liniile I/O poate fi conectată la un buton, comutator, LED sau orice alt control utilizat în dispozitivele electronice, organizând astfel fluxurile de date de intrare și ieșire De exemplu, dacă microprocesorul este instalat într-un ceas cu alarmă, atunci toate butoanele și comutatoarele sale sunt conectate la diferite linii I/O și un număr de linii controlează citirile afișate Astfel, toate (sau aproape toate) funcțiile ceasului cu alarmă sunt sub control software și nu este nevoie de circuite logice discrete scumpe Pinout-ul chipului este prezentat în fig Memoria internă implicită este de KB (sau KB pe ) Dacă această cantitate este insuficientă, memoria poate fi extinsă prin conectarea unui modul suplimentar cu o capacitate de până la KB prin intermediul magistralei Primele șapte semnale prezentate în partea stângă a Fig , sunt folosite pentru a se conecta la memoria externă, dacă există Primul semnal, A, conține linii de adresă care se adresează unui octet de memorie externă pentru citire sau scriere Opt linii D sunt folosite pentru transmiterea datelor Orez Pinout cip Exemple de anvelope Cele opt linii de adrese de ordin inferior sunt partajate cu aceiași pini ca și liniile de date, reducând numărul total de pini Când se efectuează o tranzacție cu magistrala, adresa (în timpul primului ciclu) și datele (în timpul ciclurilor ulterioare) sunt transferate prin acești pini Când utilizați memorie externă, indică operațiunile de citire și scriere a memoriei prin setarea semnalelor RD și, respectiv, WR Prezența memoriei externe necesită un semnal ALE (Address Latch Enable) Prin afirmarea acestui semnal, CPU verifică dacă adresa este corectă Memoria externă, folosind acest semnal, pune de obicei zăvoare pe liniile de adresă, care după un timp scurt sunt eliberate și vă permit să continuați transferul de date prin pini Semnalele PSEN și EA# sunt, de asemenea, legate de memoria externă Semnalul PSEN (Program Store Enable) este setat dacă procesorul intenționează să citească date din memoria programului De obicei se corelează cu semnalul de memorie OE (vezi Figura ) Semnalul EA# (Acces extern - acces la memoria externă) este de obicei trimis fie ca zero, fie ca unu; dar în orice caz, sensul său în fiecare caz este neschimbat În cazul unuia, se folosește memoria internă de KB pentru a procesa adrese din intervalul specificat ( KB în modelul ), iar pentru adresele rămase se folosește memoria externă În cazul zero, toate adresele sunt procesate în memoria externă, iar memoria internă rămâne inactivă În modelele și , din cauza lipsei de memorie încorporată, semnalul EA# ar trebui să fie setat doar la zero Două linii de cronometru asigură transferul de date de la temporizatoarele externe la procesor Două linii de întrerupere permit două dispozitive externe să solicite întreruperi ale procesorului Liniile TXD și RXD oferă I/O seriale cu un terminal sau modem În cele din urmă, linia RST permite utilizatorilor și dispozitivelor externe să repornească De obicei, această linie este semnalată în cazul unei defecțiuni care necesită o repornire a sistemului Deci, procesorul este similar cu majoritatea celorlalte procesoare pe biți, iar singura sa caracteristică este prezența liniilor I/O seriale de astfel de linii sunt combinate în porturi prezentate în partea dreaptă a fig Toate liniile sunt bidirecționale, iar operațiunile de citire și scriere prin ele sunt efectuate sub control software Așa interacționează procesorul cu mediul în cele mai multe cazuri, iar acesta este ceea ce îl face extrem de util - funcțiile procesor, memorie și I/O sunt implementate pe același cip Exemple de anvelope Autobuzele conectează sistemul informatic într-un singur întreg În această secțiune, vom analiza câteva exemple de autobuze: ISA, PCI și USB Autobuzul ISA este o versiune ușor îmbunătățită a magistralei IBM PC, prima magistrală pentru calculatoarele personale IBM Din motive de compatibilitate, a fost instalat în toate computerele personale în urmă cu câțiva ani Capitolul Nivel logic digital Calculatoare Intel, dar ulterior Intel și Microsoft au convenit să nu mai susțină acest lucru În orice caz, computerele cu o magistrală ISA care nu sunt prea "vechi" conțin întotdeauna o altă magistrală care este mai rapidă decât ISA Aceasta este magistrala PCI Este mai lat decât ISA și rulează la o viteză mai mare de ceas Prin urmare, transmite mai multe date într-o secundă decât ISA În majoritatea PC-urilor moderne, ea este cea care preia sarcina principală, deși recent rolul magistralelor USB a devenit din ce în ce mai vizibil, utilizate ca instrument de intrare/ieșire pentru dispozitivele periferice cu viteză redusă (cum ar fi șoarecii și tastaturile) În secțiunile următoare, vom analiza pe rând fiecare dintre aceste anvelope Autobuz ISA Autobuzul IBM PC a fost un standard neoficial pentru sistemele cu procesor , deoarece aproape toți producătorii de clone l-au copiat pentru a putea folosi carduri I/O de la diverși producători în sistemele lor Autobuzul conținea de linii de semnal, dintre ele pentru adrese de memorie, pentru date și câte una pentru citirea informațiilor din memorie, scrierea informațiilor în memorie, citirea de la un dispozitiv I/O și scrierea pe un dispozitiv I/O Au existat și semnale pentru solicitarea și gestionarea întreruperilor, precum și pentru accesul direct la memorie Anvelopa era foarte primitivă Autobuzul IBM PC a fost încorporat în placa de bază a unui computer personal Pe placă erau mai mulți conectori, aflați la o distanță de cm unul de celălalt În conectori au fost introduse diverse plăci Plăcile aveau pini placați cu aur ( pe fiecare parte) care se potrivesc fizic sub conectori Prin intermediul acestora s-a realizat contact electric cu conectorii Când IBM dezvolta computerul PC AT cu procesorul , a întâmpinat unele dificultăți Pe de o parte, dacă compania a dezvoltat o magistrală complet nouă pe biți, mulți potențiali cumpărători nu ar cumpăra acest computer, deoarece niciuna dintre cardurile de înlocuire fabricate de alte companii nu s-ar potrivi noului aparat Pe de altă parte, dacă compania ar decide să păstreze vechea magistrală cu de linii de adresă și linii de date, atunci noul procesor nu și-ar putea realiza toate capacitățile (de exemplu, capacitatea de a accesa MB de memorie și de a transfera) cuvinte pe biți) Ca urmare, s-a decis îmbunătățirea anvelopei vechi Plăcile plug-in pentru computerele personale conțineau un conector de margine ( de pini), dar acest conector de margine nu a rulat pe toată lungimea plăcii Prin urmare, pe placă a fost plasat un alt conector de margine, adiacent celui principal Circuitele PC/AT au fost proiectate astfel încât să poată fi conectate ambele tipuri de plăci Pe fig arată magistrala PC / AT Al doilea conector de margine al magistralei PC/AT conține de linii Dintre acestea, sunt pentru linii de adrese suplimentare, linii de informații, linii de întrerupere, canale de acces direct la memorie, precum și pentru alimentare și masă Exemple de anvelope Liniile rămase sunt concepute pentru a compensa diferența dintre transmisiile pe biți și rânduri Orez Autobuzul PC/AT combină anvelopele vechi și noi Când IBM a lansat seria de calculatoare PS/ , era timpul să începem din nou dezvoltarea autobuzului Pe de o parte, această decizie s-a datorat unor motive pur tehnice (autobuzul RS era deja depășit la acel moment) Dar, pe de altă parte, a fost cauzată de dorința de a "pune în loc" companiile care produceau clone, care la acea vreme au inundat piața calculatoarelor Prin urmare, computerele PS/ de gamă înaltă și medie au fost echipate cu o magistrală MCA (Arhitectura MicroChannel) complet nouă, care a fost protejată de brevete Industria calculatoarelor a răspuns la această mișcare prin introducerea propriului standard, magistrala Industry Standard Architecture (ISA), care este în esență o magistrală PC/AT care rulează la , MHz Avantajul acestei abordări este că menține compatibilitatea cu mașinile și plăcile existente Rețineți că acest standard se bazează pe un autobuz dezvoltat de IBM IBM a acordat odată fără gânduri drepturile de a produce acest autobuz multor companii, astfel încât cât mai mulți producători să poată produce plăci pentru calculatoarele IBM Cu toate acestea, ulterior, IBM a trebuit să regrete foarte mult acest lucru Autobuzul a fost folosit până la un timp în toate computerele personale cu procesor Intel, deși de obicei instalau unul sau mai multe alte autobuze în plus față de acesta Capitolul Nivel logic digital Autobuzul ISA a fost extins ulterior la de biți Are câteva caracteristici noi (de exemplu, posibilitatea de procesare paralelă) Această magistrală se numește EISA (Extended Industry Standard Architecture) magistrala PCI La primele PC-uri IBM, majoritatea aplicațiilor erau bazate pe text Odată cu apariția Windows, interfețele grafice cu utilizatorul au intrat treptat în uz Niciuna dintre aceste aplicații nu pune prea mult stres pe magistrala ISA Cu toate acestea, de-a lungul timpului, au apărut multe aplicații diferite, inclusiv jocuri care necesită videoclipuri pe ecran complet, iar situația s-a schimbat dramatic Hai să facem niște calcule mici Luați în considerare un monitor de x cu o ieșire de imagine color în mișcare ( octeți/pixel) O imagine de pe ecran conține , MB de date Redarea în mișcare lină necesită de cadre pe secundă și, prin urmare, rata de date trebuie să fie de , MB/s În realitate, situația este mult mai gravă, deoarece pentru a transfera o imagine, datele trebuie să fie transferate de pe un hard disk, CD sau DVD printr-un autobuz în memorie Apoi datele trebuie să ajungă la adaptorul grafic (tot prin magistrală) Astfel, numai pentru transmisia video, lățimea de bandă a magistralei ar trebui să fie de MB/s Totuși, computerul are și o unitate centrală de procesare și alte dispozitive care trebuie să folosească și magistrala, astfel încât debitul trebuie să fie și mai mare Frecvența maximă de transfer de date a magistralei ISA este de , MHz Este capabil să transfere doi octeți pe ciclu, astfel încât debitul său maxim este de , MB/s Autobuzul EISA poate transfera octeți pe ciclu Lățimea de bandă ajunge la , MB/s Este clar că niciunul dintre ele nu este complet în conformitate cu ceea ce este necesar pentru videoclipurile pe ecran complet În , Intel a dezvoltat o nouă magistrală cu lățime de bandă mult mai mare decât magistrala EISA Această magistrală a fost numită PCI (Peripheral Component Interconnect - interacțiunea componentelor periferice) Intel a brevetat magistrala PCI și a făcut publice toate brevetele, astfel încât orice companie să poată produce periferice pentru acest autobuz fără nicio plată pentru dreptul de utilizare a brevetului Intel a format, de asemenea, un consorțiu industrial, PCI Special Interest Group, pentru a îmbunătăți în continuare magistrala PCI Toate aceste activități au dus la faptul că magistrala PCI a devenit extrem de populară Practic, fiecare computer Intel (începând cu Pentium), precum și multe alte computere, au o magistrală PCI Chiar și Sun a lansat o versiune a UltraSPARC (computer UltraSPARC III) care utilizează magistrala PCI Busul PCI este descris în detaliu în literatură [ , ] Prima magistrală PCI a transmis de biți pe ciclu și a funcționat la o frecvență de MHz (timp de ciclu - ns), debitul total a fost de MB / s În a apărut magistrala PCI , iar în , magistrala PCI Bus PCI sub Exemple de anvelope este valabil pentru computerele portabile (unde este necesară economisirea bateriei) În final, am reușit să obținem o magistrală PCI care funcționează la o frecvență de MHz, este capabilă să transmită de biți pe ciclu, iar debitul său total este de MB/s Cu această performanță, videoclipul pe ecran complet este destul de realizabil (presupunând că discul și alte dispozitive din sistem își fac treaba) În orice caz, magistrala PCI nu este "gâtul de sticlă" al sistemului Deși MB/s este o rată de transfer de date destul de mare, există încă câteva probleme aici În primul rând, acest lucru nu este suficient pentru magistrala de memorie În al doilea rând, magistrala PCI este incompatibilă cu toate plăcile ISA mai vechi Din acest motiv, Intel a ales să proiecteze computere cu trei sau mai multe magistrale, așa cum se arată în Figura Aici vedem că CPU poate comunica cu memoria principală printr-o magistrală de memorie specială, iar magistrala ISA poate fi conectată la magistrala PCI O astfel de arhitectură în anii a îndeplinit toate cerințele moderne la acea vreme și, prin urmare, a fost folosită în majoritatea sistemelor Cache autobuz Autobuz de memorie L cache /L autobuz local CPU magistrala PCI SCSI USB Podul ISA Tastatură mouse - unitate IDE Adaptor grafic Monitorizați Autobuz ISA Modem Placă de sunet Imprimantă Orez Arhitectura unui sistem tipic Pentium de generație timpurie (Grosimea liniilor care indică un autobuz are scopul de a indica capacitatea acestuia Cu cât linia este mai groasă, cu atât capacitatea este mai mare ) -Memoria principala Slot PCI gratuit Slot ISA gratuit Componentele cheie ale acestei arhitecturi sunt punțile dintre autobuze (aceste microcircuite sunt fabricate de Intel - de unde și interesul pentru proiect) Puntea PCI conectează CPU, memoria și magistrala PCI Pod Capitolul Nivel logic digital ISA conectează magistrala PCI la magistrala ISA și acceptă, de asemenea, una sau două unități IDE Aproape toate sistemele Pentium vin cu unul sau mai multe sloturi PCI libere pentru conectarea perifericelor suplimentare de mare viteză și cu unul sau mai multe sloturi ISA pentru conectarea perifericelor de viteză redusă Avantajul sistemului prezentat în fig este că magistrala dintre CPU și memorie are o lățime de bandă mare, magistrala PCI are, de asemenea, o lățime de bandă mare și este bine potrivită pentru interacțiunea cu periferice de mare viteză (unități SCSI, adaptoare grafice etc ), și atunci când poate încă utilizați plăci ISA mai vechi Figura prezintă și magistrala USB, despre care vom discuta mai târziu în acest capitol Ar fi bine dacă ar exista un singur tip de placă PCI Din păcate, nu este Plăcile diferă în ceea ce privește consumul de energie, adâncimea de biți și sincronizare Calculatoarele mai vechi folosesc de obicei V, în timp ce cele mai noi folosesc , V, astfel încât magistrala PCI le acceptă pe ambele Conectorii sunt la fel (se deosebesc doar prin două mici inserții din plastic care nu vă permit să introduceți o placă de V într-o magistrală PCI de , V și invers) Din fericire, există plăci universale care suportă ambele tensiuni și care pot fi introduse în orice slot Plăcile diferă nu numai prin tensiune, ci și prin adâncimea de biți Există două tipuri de carduri: pe de biți și pe de biți Plăcile pe de biți conțin de pini; Plăcile pe de biți conțin aceiași de pini plus de pini suplimentari, similar modului în care magistrala IBM PC a fost extinsă la biți (vezi Figura ) O magistrală PCI care acceptă plăci pe de biți poate suporta și plăci pe de biți, dar inversul nu este adevărat În cele din urmă, magistralele PCI și plăcile aferente pot funcționa fie la MHz, fie la MHz În ambele cazuri, contactele sunt identice Diferența este că unul dintre pini este conectat fie la sursa de alimentare, fie la masă Până la sfârșitul anilor , autobuzul ISA a fost complet îngropat de participanții de pe piață, iar sprijinul său nu mai era prevăzut în sisteme noi Datorită rezoluției din ce în ce mai mare a ecranului (atingând x pixeli), precum și a cererii de video pe tot ecranul la o rată de cadre standard, relevantă în special în jocurile interactive, Intel a dezvoltat o nouă magistrală dedicată exclusiv comunicării cu adaptorul grafic Această magistrală se numește AGP (Accelerated Graphics Port) Prima sa versiune, AGP , a rulat la MB/s, iar această valoare a fost luată ca x Lipsa vitezei (față de PCI) a fost compensată de o specializare îngustă în managementul adaptorului grafic Ulterior, au fost dezvoltate noi versiuni ale autobuzului - în special, AGP funcționează la o viteză de , GB / s ( x) Dispunerea autobuzului într-un sistem modern Pentium este ilustrată în Fig , În acest sistem, poziția centrală este ocupată de puntea dintre anvelope Conectează cele cinci componente principale ale sistemului: procesor, memorie, adaptor grafic, controler ATARI și magistrală PCI În unele cazuri, alimentează și NIC-uri Ethernet și alte dispozitive de mare viteză Dispozitivele care funcționează la viteze mai mici sunt conectate la magistrala PCI Exemple de anvelope Orez , Dispunerea autobuzului într-un sistem modern Pentium Conform structurii sale interne, puntea este împărțită în două părți: puntea de memorie și puntea I/O Puntea de memorie conectează procesorul la memorie și adaptorul grafic Puntea I/O conectează controlerul ATAI, magistrala PCI și (dacă este necesar) alte dispozitive I/O de mare viteză între ele Datele dintre aceste două punți sunt transmise la o viteză foarte mare Autobuzele PCI sunt sincrone, la fel ca toate magistralele PC care datează de la primul PC IBM Toate tranzacțiile de pe magistrala PCI sunt între master și slave Pentru a nu crește numărul de pini de pe placă, liniile de adresă și informații sunt combinate În același timp, de pini sunt suficienți pentru întregul set de semnale de adresă și informații, chiar dacă PCI funcționează cu adrese pe de biți și date pe de biți Ieșirile combinate de adresă și informații funcționează după cum urmează Când este citită în timpul primului ciclu, șoferul transferă adresa către autobuz În timpul celui de-al doilea ciclu, masterul elimină adresa și magistrala este comutată astfel încât slave să o poată utiliza În timpul celui de-al treilea ciclu, slave emite datele solicitate Când scrieți, magistrala nu trebuie să comute, deoarece șoferul îi transmite atât adresa, cât și datele Cu toate acestea, tranzacția minimă durează trei cicluri Dacă dispozitivul slave nu poate răspunde în trei cicluri, atunci se intră în modul de așteptare Permis Capitolul Nivel logic digital transferuri de blocuri de dimensiuni nelimitate, precum și alte tipuri de cicluri de autobuz Arbitrajul magistralei PCI Pentru a transmite orice semnal pe magistrala PCI, dispozitivul trebuie mai întâi să obțină acces la acesta Busul PCI este controlat de un arbitru centralizat, așa cum se arată în Fig , În cele mai multe cazuri, arbitrul de autobuz este încorporat într-unul dintre podurile de autobuz Există două linii speciale de la fiecare dispozitiv PCI la arbitru Unul dintre ele (REQ#) este folosit pentru a solicita magistrala, iar al doilea (GNT#) este folosit pentru a obține permisiunea de a accesa magistrala Orez , Autobuzul PCI are un arbitru centralizat Pentru a face o cerere de acces la magistrală, dispozitivul PCI (inclusiv CPU) setează semnalul REQ# și așteaptă până când arbitrul setează semnalul GNT# Dacă arbitrul setează semnalul GNT#, atunci dispozitivul poate folosi magistrala în următorul ciclu Algoritmul folosit de arbitru nu depinde de caracteristicile tehnice ale magistralei PCI Arbitrajul în cerc, arbitrajul prioritar și alte scheme de arbitraj sunt permise Un arbitru bun trebuie să fie corect pentru a nu face ca dispozitivele individuale să aștepte de veacuri Autobuzul este furnizat pentru o singură tranzacție, deși durata acestei tranzacții este teoretic arbitrară Dacă un dispozitiv trebuie să comite o a doua tranzacție și niciun alt dispozitiv nu solicită magistrala, acesta poate prelua din nou magistrala, deși de obicei este necesar să se introducă o buclă goală între tranzacții Cu toate acestea, în circumstanțe speciale (în absența unei dispute pentru accesul la magistrală), un dispozitiv poate face tranzacții consecutive fără cicluri de inactivitate între ele Dacă dispozitivul master efectuează un transfer foarte lung și un alt dispozitiv a emis o cerere de acces la magistrală, arbitrul poate șterge linia GNT# Se presupune că driverul monitorizează linia GNT# Dacă semnalul este șters, dispozitivul trebuie să elibereze magistrala în următorul ciclu Un astfel de sistem permite transferuri foarte lungi (ceea ce este destul de rațional) fără nicio dispută pentru accesul la autobuz, dar răspunde rapid și la solicitările de magistrală de la alte dispozitive Exemple de anvelope Semnale magistrală PCI Busul PCI acceptă un număr de semnale obligatorii (Tabelul ) și un număr de semnale opționale (Tabelul ) Pinii rămași sunt folosiți pentru alimentare, împământare și o varietate de semnale aferente Coloanele Master și Slave indică ce dispozitiv setează semnalul într-o tranzacție normală Dacă semnalul este setat de un alt dispozitiv (de ex CLK), ambele coloane sunt lăsate necompletate Tabelul - Semnale obligatorii de magistrală PCI Semnal Număr de linii Master Slave Comentariu CLK generator de ceas ( MHz sau MHz) AD Da Da Adresă și linii de date combinate PAR Da Bit de paritate pentru adresa sau date C/BE# Da În primul rând, o comandă către magistrală, în al doilea rând, un bitmap care indică ce octeți din cuvânt ar trebui să fie citiți (sau scrieți) FRAME# Da Indică faptul că semnalele AD și C/BE sunt setate IRDY# DA Când este citit, înseamnă că masterul este gata să primească date; la scriere - că datele sunt în magistrală IDSEL Da Citiți spațiul de configurare DEVSEL# Da Slavul și-a recunoscut adresa și așteaptă un semnal TRDY# Da Când citiți, înseamnă că datele sunt pe liniile AD; la scriere - că dispozitivul slave este pregătit să primească date STOP# Da Dispozitivul slave solicită o întrerupere imediată a tranzacției curente PERR# Eroare de paritate a datelor detectată SERR# Paritatea adresei sau eroarea de sistem a fost detectată REQ# Arbitraj autobuz - Solicitare acces autobuz GNT# Arbitraj pentru autobuze - Grant autobuz RST# Reporniți sistemul și toate dispozitivele Capitolul Nivel logic digital Tabelul Semnale opționale de magistrală PCI Semnal Număr de linii Master Slave Comentariu REQ # Da Solicitare pentru o tranzacție pe de biți ACK # Da Activați tranzacția pe de biți AD Da de biți suplimentari de adresă sau date PAR Da Paritate pentru de biți suplimentari de adresă sau date C/BE# Da biți suplimentari pentru a indica ce octeți ai cuvântului să citească (sau să scrie) BLOCARE Da SBO# Pe sistemele multiprocesor, accesarea memoriei cache a altui procesor SDONE În sistemele multiprocesor, semnalați sfârșitul monitorizării INTx Solicitare de întrerupere Semnale de testare JTAG IEEE JTAG M EN Semnalul este conectat la sursa de alimentare sau la masă ( MHz sau MHz) Acum să ne uităm la fiecare semnal de pe magistrala PCI separat Să începem cu semnalele necesare ( de biți) și apoi să trecem la semnalele opționale ( de biți) Semnalul CLK pornește autobuzul Majoritatea semnalelor coincid cu el în timp Spre deosebire de magistrala ISA, în magistrala PCI, o tranzacție începe la căderea semnalului CLK, adică nu la începutul ciclului, ci la mijloc Semnalele AD (există ) sunt necesare pentru adrese și date (pentru transmisii pe de biți) De obicei, adresa este setată în timpul primului ciclu, iar datele în timpul celui de-al treilea Semnalul PAR este bitul de paritate pentru semnalul AD Semnalul C/BE# are două funcții În timpul primului ciclu, acesta conține o comandă (citește un cuvânt, citește bloc etc ) În timpul celui de-al doilea ciclu, acesta conține o matrice de biți care arată ce octeți ai cuvântului de de biți sunt validi Folosind semnalul C/BE#, se pot citi , sau octeți dintr-un cuvânt, precum și întregul cuvânt Semnalul FRAME# este setat de master pentru a începe o tranzacție Acest semnal îi spune slave că adresa și comenzile sunt valabile în prezent Când citiți în același timp cu semnalul FRAME#, semnalul IRDY# este setat Raportează că dispozitivul principal Exemple de anvelope gata să primească date La scriere, semnalul IRDY# este setat ulterior, când datele au fost deja transferate pe magistrală Semnalul IDSEL se datorează faptului că fiecare dispozitiv PCI trebuie să aibă un spațiu de configurare de de octeți pe care îl pot citi și alte dispozitive (prin setarea semnalului IDSEL) Acest spațiu de configurare conține caracteristicile dispozitivului Pe unele sisteme de operare, Plug and Play (PnP) folosește acest spațiu pentru a afla ce dispozitive sunt conectate la magistrală Acum luați în considerare semnalele care sunt setate de dispozitivul slave Semnalul DEVSEL# înseamnă că dispozitivul slave și-a recunoscut adresa pe liniile AD și este gata să participe la tranzacție Dacă semnalul DEVSEL# nu este primit pentru o anumită perioadă de timp, dispozitivul principal presupune că dispozitivul slave către care este direcționat apelul este fie absent, fie defect Următorul semnal este TRDY# Sclavul său se setează pe citire pentru a indica că datele sunt pe liniile AD și pe scriere pentru a indica că este gata să primească date Următoarele trei semnale sunt necesare pentru raportarea erorilor Unul dintre ele, semnalul STOP#, este setat de slave dacă ceva nu merge bine și trebuie să anuleze tranzacția curentă Următorul semnal, PERR#, este utilizat pentru a raporta o eroare de paritate în datele din ciclul anterior Pentru citire, acest semnal este setat de dispozitivul master, pentru scriere, de dispozitivul slave Dispozitivul care primește acest semnal trebuie să ia măsurile necesare În cele din urmă, semnalul SERR# este utilizat pentru a raporta erorile de adresă și de sistem Semnalele REQ# și GNT# sunt pentru arbitrajul magistralei Ele sunt setate nu de dispozitivul care este maestru în acest moment, ci de cel care trebuie să devină maestru Semnalul obligatoriu final, RST#, este folosit pentru a reporni sistemul, care apare fie dacă utilizatorul apasă butonul RESET, fie dacă un dispozitiv de sistem întâlnește o eroare fatală După ce acest semnal este setat, computerul repornește Să trecem la semnalele opționale, dintre care majoritatea sunt legate de extinderea adâncimii de biți de la la de biți Semnalele REQ # și ACK # permit masterului să ceară permisiunea de a executa o tranzacție pe de biți și ca slave să accepte tranzacția Semnalele AD, PAR și C/BE# sunt extensii ale semnalelor corespunzătoare pe de biți Următoarele trei semnale nu sunt legate de trecerea de la la de biți Sunt utilizate în sistemele multiprocesor Nu toate plăcile PCI acceptă aceste sisteme, deci aceste semnale sunt opționale Semnalul LOCK vă permite să blocați magistrala pentru tranzacții concurente Următoarele două semnale sunt legate de faza de urmărire, ceea ce vă permite să păstrați cache-urile diferitelor procesoare consistente Semnalele INTx sunt necesare pentru a solicita întreruperi Placa PCI poate conține până la patru dispozitive logice, fiecare cu propria sa linie Capitolul Nivel logic digital cerere de întrerupere Semnalele JTAG sunt pentru procedura de testare IEEE JTAG În cele din urmă, semnalul M EN este legat fie de sursa de alimentare, fie de masă, ceea ce determină frecvența ceasului Nu ar trebui să se schimbe în timp ce sistemul rulează Tranzacții pe magistrala PCI Busul PCI este de fapt foarte simplu Pentru a înțelege mai bine acest lucru, luați în considerare diagrama de timp din Fig , Aici vedem o tranzacție de citire, urmată de o buclă goală și o tranzacție de scriere, care este efectuată de același driver Orez , Exemple de tranzacții pe de biți pe magistrala PCI În timpul primelor trei cicluri, are loc o operație de citire, apoi un ciclu gol, iar următoarele trei cicluri, o operație de scriere În timpul ciclului Tt, pe frontul descendent al semnalului de ceas, șoferul plasează adresa pe liniile AD și comanda pe liniile C/BE# Driverul setează apoi semnalul FRAME# pentru a începe tranzacția În timpul ciclului T , masterul comută magistrala astfel încât dispozitivul slave să o poată utiliza în timpul ciclului T De asemenea, șoferul modifică semnalul C/BE# pentru a indica ce octeți din cuvânt ar trebui să citească În timpul ciclului T , slave afirmă semnalul DEVSEL# Acest semnal îi spune maestrului că sclavul este Exemple de anvelope adresa chilo si merg sa raspund Dispozitivul slave pune, de asemenea, date pe liniile AD și emite semnalul TRDY#, care informează dispozitivul master despre această acțiune Dacă dispozitivul slave nu poate răspunde rapid, nu dezactivează semnalul DEVSEL# indicând prezența acelui dispozitiv, dar nu afirmă semnalul TRDY# până când nu poate trimite date Această procedură introduce una sau mai multe perioade de așteptare În exemplul nostru (ceea ce se poate întâmpla de fapt), următoarea buclă este goală Vedem că în ciclul T același driver inițiază procesul de scriere Mai întâi pune adresa și comanda pe autobuz, ca de obicei În ciclul următor, scoate date Deoarece liniile AD sunt controlate de același dispozitiv, nu este necesar niciun ciclu de comutare În ciclul T , memoria primește date PCI Express Capacitățile magistralei PCI sunt suficiente pentru majoritatea aplicațiilor moderne, dar nevoia de I/O mai rapidă dezorganizează treptat arhitectura internă odată subțire a computerului Figura arată clar că magistrala PCI nu mai este piesa centrală care ține împreună componentele PC-ului Acest rol este acum îndeplinit de puntea dintre anvelope Esența problemei constă în faptul că, în timp, apar tot mai multe dispozitive I/O, ale căror cerințe de performanță nu se potrivesc cu capacitățile magistralei PCI Overclockarea ceasului magistralei este departe de a fi cea mai bună soluție, deoarece nu face decât să exacerbeze deformarea magistralei, diafonia firelor și capacitatea Ori de câte ori apare un dispozitiv nou care este prea rapid pentru magistrala PCI (fie că este un adaptor grafic, un hard disk, un controler de rețea etc ), dezvoltatorii Intel trebuie să creeze un alt port specializat cu care puntea permite acestui dispozitiv să ocolească magistrala PCI Desigur, o astfel de soluție devine din ce în ce mai puțin eficientă cu fiecare precedent Un alt dezavantaj al magistralei PCI este dimensiunile excesive ale plăcilor Sunt greu de incadrat in carcasele calculatoarelor portabile moderne, ca sa nu mai vorbim de modelele de buzunar În același timp, producătorii reduc în mod constant dimensiunea dispozitivelor lor În plus, unii producători intenționează să treacă la un nou aspect al dispozitivelor în carcasele PC-ului - mai precis, plasați procesorul și memoria într-un compartiment închis separat și hard disk-ul în interiorul monitorului Plăcile PCI nu permit implementarea acestor planuri Acum se propun mai multe soluții la aceste probleme, dar, cel mai probabil, câștigătoarea în competiție va fi tehnologia PCI Express, care este promovată activ de Intel În ciuda numelui, nu are aproape nimic de-a face cu magistrala PCI; În plus, nu este deloc o anvelopă Cu toate acestea, marketerii au decis să nu scape de numele "PCI" - din fericire, este pe buzele tuturor Unele PC-uri acceptă deja această tehnologie Să vedem ce este Capitolul Nivel logic digital Arhitectura PCI Express Esența tehnologiei PCI Express este înlocuirea magistralei paralele cu varietatea sa de dispozitive master și slave cu conexiuni seriale punct la punct de mare viteză Această decizie marchează plecarea definitivă de la topologia magistralei implementată în magistralele ISA/EISA/PCI și trecerea la topologia rețelelor locale (în special rețelele Ethernet comutate) Ideea de bază este aceasta: în esență, un PC este un set de cipuri ale unui procesor, memorie și dispozitive I/O care trebuie interconectate Având în vedere această circumstanță, PCI Express acționează ca un comutator universal care conectează cipurile prin canale seriale Configurația standard PCI Express este prezentată în fig , Orez , Aspect standard al sistemului PCI Express După cum puteți vedea din figură, procesorul, memoria și memoria cache sunt conectate la bridge în mod tradițional Noul element aici este comutatorul conectat la punte (uneori este construit direct în cipul de punte) Se stabilește o conexiune punct la punct între fiecare cip de dispozitiv I/O, pe de o parte, și comutator, pe de altă parte Orice astfel de conexiune constă din două legături unidirecționale, câte una în fiecare direcție între dispozitiv și comutator Canalele constau din două fire (semnal și masă), care asigură imunitate ridicată la zgomot în timpul transmisiei de semnal de mare viteză Această arhitectură diferă de cea anterioară prin o mai mare unificare și egalitate a tuturor dispozitivelor Trei puncte principale disting arhitectura PCI Express de arhitectura PCI Am luat în considerare deja două dintre ele - aceasta este prezența unei comunicări centralizate Exemple de anvelope tator, care a înlocuit principiul unei magistrale multi-tap și utilizarea conexiunilor seriale înguste punct-la-punct în loc de o magistrală paralelă largă A treia diferență este mai puțin vizibilă Modelul conceptual pe care se bazează magistrala PCI este că magistrala magistrală instruiește sclavii să citească un cuvânt sau un bloc de mai multe cuvinte PCI Express se bazează pe un principiu diferit, care implică trimiterea de pachete de date de la un dispozitiv la altul Conceptul de pachet format dintr-un antet și o sarcină utilă este împrumutat de la tehnologiile de rețea Antetul conține informații de control, ceea ce înseamnă că nu este nevoie de numeroase semnale de control care joacă un rol important în transmisia prin magistrala PCI Sarcina utilă conține datele transmise direct Astfel, un PC care acceptă tehnologia PCI Express seamănă cu o rețea cu comutare de pachete în miniatură Pe lângă cele mai importante modificări enumerate mai sus, există și unele mai puțin vizibile În special, pachetele folosesc un cod de detectare a erorilor mai fiabil decât cel PCI În plus, lungimea fizică a conexiunii dintre cip și comutator a crescut la cm, fapt pentru care a devenit mai convenabil să se schimbe poziția componentelor sistemului Deoarece un alt comutator poate fi conectat la comutatorul de bază, formând astfel o structură arborescentă, scalabilitatea sistemului este crescută În plus, dispozitivele din PCI Express sunt conectabile la cald, ceea ce înseamnă că pot fi îndepărtate și montate direct în acest proces În cele din urmă, deoarece conectorii seriali sunt mult mai mici decât conectorii PCI mai vechi, nimic nu îi împiedică pe producători să dezvolte dispozitive și computere compacte Astfel, există o respingere decisivă a principiilor magistralei PCI Stiva de protocoale PCI Express Urmând modelul de rețea cu comutare de pachete, tehnologia PCI Express se bazează pe o stivă de protocoale stratificată Un protocol este un set de reguli care definesc mecanismul de interacțiune între două părți În consecință, stiva de protocoale este un sistem ierarhic de protocoale care reglementează diverse aspecte ale interacțiunii la diferite niveluri Să luăm ca exemplu o scrisoare de afaceri Există anumite convenții despre locația și conținutul capului scrisorii, adresa destinatarului, data, forma salutului, corpul scrisorii, semnăturile etc Toate aceste convenții pot fi numite colectiv protocolul de o scrisoare de afaceri În plus, există standarde privind dimensiunea și formatul plicului, amplasarea ștampilei și subtilități similare Aceste două straturi și protocoalele lor respective sunt independente unul de celălalt De exemplu, puteți schimba complet formatul scrisorii, punându-l într-un plic standard și invers Astfel de protocoale stratificate, care permit dezvoltarea modulară cu un nivel ridicat de flexibilitate, au fost utilizate pe scară largă în software-ul de rețea de zeci de ani În tehnologia PCI Express, s-a încercat să le implementeze în hardware-ul "autobuz" Stiva de protocoale PCI Express este prezentată în Fig , a Capitolul Nivel logic digital Nivelul programului Nivelul tranzacției Stratul de legătură Strat fizic I Antet I Sarcină utilă | I Numărul I Titlu | Sarcină utilă | CRC | I Cadrul I Numărul | Titlu | Sarcină utilă | CRC | Cadru | b A Orez , Stiva de protocoale PCI Express (a); format pachet (b) Să luăm în considerare nivelurile în ordine crescătoare Cel mai de jos este stratul fizic Este responsabil pentru transmiterea biților de la emițător la receptor printr-o conexiune punct la punct Fiecare astfel de conexiune constă dintr-una sau mai multe perechi de canale simplex (unidirecționale) În cel mai simplu caz, se alocă câte o pereche pentru fiecare direcție, dar este posibil să existe și , , , sau de perechi Canalele în perechi se numesc benzi Fiecare sens trebuie să aibă același număr de benzi Prima generație oferă rate de transfer de date de , GB/s pentru fiecare direcție, dar după ceva timp această cifră va ajunge probabil la GB/s Spre deosebire de magistralele ISA, EISA și PCI, tehnologia PCI Express nu oferă un generator de ceas Dispozitivele au dreptul de a începe transmisia în orice moment, de îndată ce au ceva de transmis O astfel de libertate, pe de o parte, crește performanța, pe de altă parte, creează o problemă Să presupunem că un este codificat cu + V și un este codificat cu V Dacă primii câțiva octeți sunt zero, de unde știe receptorul că datele îi sunt trimise? Într-adevăr, o secvență de zero biți este greu de distins de un canal inactiv Această problemă este rezolvată cu ajutorul așa-numitei codări de / biți Conform acestei scheme, octet de date reale este codificat cu un caracter de biți Dintre cele de simboluri posibile pe biți, sunt selectate acelea care, datorită unui număr suficient de fronturi fără un generator principal, asigură sincronizarea emițătorului și receptorului de-a lungul limitelor de biți Datorită utilizării codificării pe / biți, lățimea de bandă totală a canalului de , GB/s se restrânge la o lățime de bandă reală de GB/s Stratul de legătură este responsabil pentru transmiterea pachetelor La acest nivel, la antetul și sarcina utilă transmise de la nivelul tranzacției se adaugă un număr de secvență și un cod de corectare a erorilor, așa-numitul CRC (Cyclic Redundancy Check - cyclic redundancy check) Codul CRC este generat prin efectuarea unui algoritm specific pe antet și sarcina utilă La primirea unui pachet, dispozitivul efectuează aceleași calcule asupra antetului și datelor și compară rezultatul cu valoarea specificată în pachet Dacă cele două rezultate se potrivesc, un pachet de validare este trimis înapoi expeditorului inițial În caz contrar, destinatarul face o cerere de retransmitere Astfel, indicatorii de integritate a datelor sunt îmbunătățiți semnificativ în comparație cu magistrala PCI, care nu implementează controlul și retransmisia datelor Exemple de anvelope Pentru a evita supraîncărcarea unui receptor lent cu pachete care provin de la un expeditor rapid, este implementat un mecanism de control al fluxului Acest mecanism se bazează pe eliberarea de către destinatar către expeditor a unui anumit număr de permisiuni de transmitere a pachetelor, în funcție de cantitatea de spațiu liber necesară pentru stocarea acestora După ce a epuizat permisiunile emise anterior, expeditorul trebuie să suspende transmisia și să aștepte noi permise Această schemă, comună în toate rețelele, previne pierderea datelor din cauza unei nepotriviri între vitezele expeditorului și receptorului La nivel de tranzacție, toate operațiunile cu magistrala sunt efectuate De exemplu, pentru a citi un cuvânt din memorie, trebuie efectuate două tranzacții, dintre care una este inițiată de procesorul sau canalul DMA care solicită date, cealaltă de obiectul țintă (furnizorul de date) Cu toate acestea, citirea și scrierea nu sunt singurele operațiuni care sunt efectuate la nivel de tranzacție Acest strat, în special, extinde capacitățile de transfer de pachete furnizate de stratul de legătură Fiecare bandă la nivel de canal este subdivizată în până la opt canale virtuale, fiecare dintre ele transportând un tip de date sau altul La nivel de tranzacție, pachetele sunt marcate în funcție de o clasă de trafic care definește un număr de proprietăți, cum ar fi "prioritate mare", "prioritate scăzută", "fără snooping", "livrare în afara secvenței permisă", etc Prin aranjarea ordinea de procesare a pachetelor, comutatorul, printre altele, se bazează pe informațiile de la markeri Orice tranzacție are loc în unul dintre cele patru spații de adresă: + spațiu de memorie (când se efectuează operații standard de citire și scriere); + spațiu I/O (pentru adresarea registrelor dispozitivului); + spațiu de configurare (pentru inițializarea sistemului etc ); + spațiu pentru mesaje (pentru trimiterea de semnale, întreruperi etc ) Memoria și spațiile I/O sunt similare cu cele tradiționale care sunt implementate în sistemele moderne În spațiul de configurare, este posibilă implementarea diferitelor tipuri de mecanisme, de exemplu, configurația automată (RPP) Spațiul de mesaje își asumă astăzi funcțiile numeroaselor semnale de control Este imposibil să faci fără acest spațiu, deoarece în PCI Express nu există linii de control prevăzute în magistrala PCI Stratul software acționează ca un intermediar între PCI Express și sistemul de operare Printre altele, oferă un mod de emulare a magistralei PCI care vă permite să instalați sisteme de operare vechi în computerele echipate cu PCI Express fără nicio modificare Desigur, atunci când lucrați în astfel de condiții, este imposibil să implementați toate caracteristicile PCI Express, dar compatibilitatea inversă este o măsură necesară - cel puțin până când toate sistemele de operare acceptă pe deplin PCI Express Experiența arată că acest proces va dura mult timp Fluxul de informații tipic pentru PCI Express este ilustrat în fig b Comanda care ajunge la nivelul programului este transmisă la nivel Capitolul Nivel logic digital arborele tranzacției în care se formează antetul și sarcina utilă Apoi aceste componente sunt trimise la stratul de legătură, la care numărul de secvență este setat în antetul pachetului, iar codul CRC este setat în coadă Acest pachet extins este apoi trecut la stratul fizic, unde parametrii de cadru sunt adăugați la ambele capete, iar pachetul fizic rezultat este transmis de la emițător la receptor Pe partea destinatarului, are loc procesul invers - antetul și coada cadrului la nivel de legătură sunt eliminate, iar rezultatul este transferat la nivelul tranzacției Schema, conform căreia se adaugă date suplimentare la setul inițial la fiecare nivel ulterior al stivei de protocoale, a fost folosită în rețelele de calculatoare de foarte mult timp și cu succes Principala diferență dintre tehnologiile de rețea și PCI Express este că, în primul caz, codul care operează la diferite niveluri ale stivei este aproape întotdeauna software și este controlat de sistemul de operare În PCI Express, pe de altă parte, operațiunile la toate nivelurile sunt implementate în hardware Structura PCI Express este destul de complexă Descrierea sa detaliată este disponibilă în [ , ] Autobuz USB Autobuzele PCI și PCI Express sunt foarte potrivite pentru conectarea perifericelor de mare viteză, dar utilizarea interfeței PCI pentru dispozitive I/O cu viteză redusă (cum ar fi șoarecii și tastaturile) ar fi prea costisitoare Inițial, fiecare dispozitiv I/O standard era conectat la computer într-un mod special, în timp ce sloturile ISA și PCI gratuite au fost folosite pentru a adăuga dispozitive noi Din păcate, această schemă are câteva dezavantaje De exemplu, fiecare dispozitiv I/O nou vine adesea cu propriul card ISA sau PCI Utilizatorul trebuie să seteze el însuși comutatoarele și jumperii de pe placă și să se asigure că placa configurată nu intră în conflict cu alte plăci Apoi utilizatorul trebuie să deschidă unitatea de sistem, să introducă cu atenție placa, să închidă unitatea de sistem și să pornească computerul Pentru mulți, acest proces este foarte complicat și duce adesea la erori În plus, numărul de sloturi ISA și PCI este foarte mic (de obicei două sau trei) Plăcile Plug and Play elimină nevoia de comutatoare, dar utilizatorul trebuie să deschidă computerul și să introducă placa În plus, numărul de sloturi de autobuz este limitat În , șapte companii (Compaq, DEC, IBM, Intel, Microsoft, NEC și Northern Telecom) s-au reunit pentru a dezvolta o magistrală care era potrivită în mod optim pentru conectarea dispozitivelor cu viteză redusă Apoi li s-au alăturat sute de alte companii Rezultatul muncii lor a fost magistrala USB (Universal Serial Bus), care este acum utilizat pe scară largă în computerele personale [ , ] Câteva dintre cerințele care au stat inițial la baza proiectului: + utilizatorii nu trebuie să instaleze comutatoare și jumperi pe plăci și dispozitive; Exemple de anvelope + utilizatorii nu trebuie să deschidă computerul pentru a instala noi dispozitive I/O; + ar trebui să existe un singur tip de cablu potrivit pentru conectarea tuturor dispozitivelor; + Dispozitivele I/O trebuie alimentate prin cablu; + ar trebui să fie posibil să se conecteze până la de dispozitive la un computer; + sistemul trebuie să suporte dispozitive în timp real (ex dispozitive de sunet, telefon); + ar trebui să fie posibilă instalarea dispozitivelor în timp ce computerul rulează; + nu ar trebui să fie nevoie să reporniți computerul după instalarea unui dispozitiv nou; + Producția unei noi magistrale și a dispozitivelor I/O pentru aceasta nu ar trebui să fie costisitoare Busul USB îndeplinește toate aceste condiții Este conceput pentru dispozitive cu viteză redusă (tastaturi, șoareci, camere foto, scanere, telefoane digitale etc ) Lățimea de bandă totală a primei versiuni a magistralei (USB ) este de , MB/s Versiunea rulează la MB/s, ceea ce este suficient de bun pentru imprimante, camere digitale și multe alte dispozitive Limita a fost aleasă pentru a reduce costul anvelopei Busul USB constă dintr-un hub rădăcină care se conectează la conectorul magistralei principale (vezi Figura ) Acest hub rădăcină (denumit adesea hub rădăcină) conține conectori pentru cabluri care pot fi conectate la dispozitive I/O sau hub-uri suplimentare pentru a crește numărul de conectori Astfel, topologia magistralei USB este un arbore înrădăcinat în hub-ul rădăcină, care se află în interiorul computerului Conectorii de cablu de pe partea dispozitivului sunt diferiți de conectorii de pe partea de hub, astfel încât utilizatorul să nu conecteze accidental cablul cu cealaltă parte Cablul este format din patru fire: două dintre ele sunt pentru transmiterea datelor, unul pentru alimentare (+ V) și unul pentru masă Sistemul transmite cu o schimbare de tensiune și fără schimbare de tensiune, astfel încât o secvență lungă de biți zero generează un flux de impulsuri regulate Când este conectat un nou dispozitiv I/O, hub-ul rădăcină detectează acest fapt și închide sistemul de operare Sistemul de operare solicită apoi un nou dispozitiv, dându-și seama ce este și de câtă lățime de bandă a magistralei necesită Dacă sistemul de operare decide că există suficientă lățime de bandă pentru acest dispozitiv, îi atribuie o adresă unică ( - ) și încarcă această adresă și alte informații în registrele de configurare din cadrul dispozitivului Astfel, noi dispozitive pot fi conectate din mers fără ca utilizatorul să fie nevoit să instaleze noi carduri ISA sau PCI Plăcile neinițializate încep la adresa , astfel încât să poată fi accesate Multe dispozitive Capitolul Nivel logic digital echipat cu hub-uri de rețea încorporate pentru dispozitive suplimentare De exemplu, un monitor poate conține două hub-uri pentru difuzoarele din dreapta și din stânga Autobuzul USB este o serie de canale între hub-ul rădăcină și dispozitivele I/O Fiecare dispozitiv își poate împărți canalul în până la sub-canale pentru diferite tipuri de date (de exemplu, audio și video) În fiecare canal sau subcanal, datele se mută de la hub-ul rădăcină la dispozitiv și invers Nu există schimb de informații între cele două dispozitive I/O Exact la fiecare milisecundă (± , ms), hub-ul rădăcină trimite un nou cadru pentru a sincroniza toate dispozitivele în timp Cadrul este format din pachete, primul fiind transmis de la hub la dispozitiv Următoarele pachete ale cadrului pot fi transmise în aceeași direcție, sau în direcția opusă (de la dispozitiv la hub) Pe fig arată patru cadre consecutive Aşteptare Cadrul SOF Timp, ms Cadrul SOF SYN PID PAYLOAD CRC Pachetul de date dispozitiv SYN PID PAYLOAD CRC SYN PID PAYLOAD CRC Orez , Hub-ul USB root transmite cadre la fiecare milisecundă Cadrele și nu au activitate, deci conțin doar un pachet SOF (Start of Frame) Acest pachet este întotdeauna trimis la toate dispozitivele Cadrul este o solicitare ordonată (de exemplu, o solicitare este trimisă scanerului pentru a trimite biți din imaginea scanată) Cadrul constă în datele trimise către un dispozitiv (cum ar fi o imprimantă) Busul USB acceptă tipuri de cadre: cadre de control, cadre izocrone, cadre de transfer de date în bloc și cadre de întrerupere Cadrele de control sunt folosite pentru a configura dispozitivele, a trimite comenzi la dispozitive și a interoga starea acestora Cadrele izocrone sunt destinate dispozitivelor în timp real (microfoane, difuzoare și telefoane) care trebuie să primească și să trimită date la intervale de timp egale Întârzierile sunt bine prezise, dar în cazul unei erori, astfel de dispozitive nu retransmit Cadrele de următorul tip sunt utilizate pentru transferuri de volum mare de la și către dispozitive (de exemplu, imprimante) Exemple de anvelope fără cerințele specifice dispozitivelor în timp real În cele din urmă, sunt necesare cadre de acest din urmă tip, deoarece magistrala USB nu acceptă întreruperi De exemplu, pentru a nu declanșa o întrerupere de fiecare dată când este apăsată o tastă, sistemul de operare poate declanșa o întrerupere la fiecare ms și poate "colecta" orice date de apăsare întârziată a tastei Un cadru este format din unul sau mai multe pachete Pachetele pot fi trimise în ambele direcții Există patru tipuri de pachete: jetoane, pachete de date, pachete de confirmare și pachete speciale Tokenurile sunt transmise de la hub la dispozitiv și sunt destinate să controleze sistemul Pachetele SOF, IN și OUT din fig , - markere Pachetul SOF (Start of Frame) este primul din orice cadru, identifică începutul cadrului Dacă nu este necesară nicio acțiune, pachetul SOF este singurul din cadru Pachetul IN este o solicitare Acest pachet necesită ca dispozitivul să furnizeze anumite date Câmpurile din pachetul IN conțin informații despre ce canal este solicitat, iar din aceste informații dispozitivul determină ce date să emită (dacă manipulează mai multe fluxuri de date) Pachetul OUT anunță că va urma transmisia de date pentru dispozitiv Ultimul tip de marcator, SETUP (nu este prezentat în figură), este utilizat în timpul configurării Pe lângă markere, există încă trei tipuri de pachete Acestea sunt pachete de date (utilizate pentru a transfera de octeți de informații în ambele direcții), pachete de confirmare și pachete speciale Formatul pachetului de date (DATA) este prezentat în fig , Acesta constă dintr-un câmp de sincronizare pe biți, un identificator de tip de pachet (PID) de biți, o sarcină utilă și un cod CRC de biți pentru detectarea erorilor Există trei tipuri de pachete de confirmare: ACK (pachetul de date anterior a fost primit corect), NAC (a fost găsită o eroare de cod CRC) și STALL (dispozitivul este ocupat, vă rugăm să așteptați) Acum să ne uităm la Fig , Hub-ul rădăcină trebuie să trimită un cadru la fiecare milisecundă, chiar dacă nu are loc nicio acțiune Cadrele și conțin un singur pachet SOF, ceea ce indică faptul că nu se întâmplă nimic Cadrul este sondaj, deci începe cu pachetele SOF și IN de la computer la dispozitivul I/O, urmate de un pachet de DATE de la dispozitiv la computer Pachetul ACK spune dispozitivului că datele au fost primite fără erori În cazul unei erori, dispozitivul primește un pachet NACK, după care datele sunt retransmise (rețineți că datele izocrone nu sunt retransmise) Cadrul este similar ca structură cu cadrul , dar fluxul de date este de la computer la dispozitiv După ce standardul USB a fost aprobat în sfârșit în , dezvoltatorii au început să creeze următoarea versiune de mare viteză a USB, numită USB Acest standard este în multe privințe similar cu USB și este compatibil cu acesta, totuși, la cele două viteze anterioare se adaugă unul nou - MB/s Toate celelalte modificări, inclusiv implementarea unei noi interfețe între hub-ul rădăcină și controler, nu sunt atât de semnificative Standardul USB a furnizat două interfețe UHCI și ONSI Interfața UHCI (Universal Host Controller Interface - o interfață universală de controler gazdă) a fost dezvoltată de Intel, transferând majoritatea grijilor către programatori (citiți - Capitolul Nivel logic digital pe Microsoft) Programatorii le-au întors favoarea și au lansat interfața ONSI (Orep Host Controller Interface - o interfață deschisă de controler gazdă), punând munca principală pe dezvoltatorii de hardware (a se citi - Intel) În timpul dezvoltării standardului USB , părțile au ajuns la o soluție reciproc acceptabilă prin lansarea unei noi interfețe numită ENCI (Enhanced Host Controller Interface - o interfață îmbunătățită a controlerului gazdă) Deoarece magistrala USB transferă acum date la MB/s, aceasta devine un concurent serios pentru magistrala serială IEEE (FireWire) care operează la MB/s Deși aproape toate sistemele moderne bazate pe Pentium sunt echipate cu USB , standardul , care este susținut de producătorii de electronice de larg consum, nu este în pericol Camerele video, DVD playerele și alte dispozitive electronice sunt susceptibile să suporte pentru o lungă perioadă de timp interfața Acest lucru se datorează faptului că producătorii lor nu sunt dispuși să cheltuiască fonduri semnificative doar pentru a trece la un standard ale cărui avantaje în comparație cu precedentul standard sunt foarte îndoielnice Sunt solidari cu utilizatorii finali, cărora nici nu le place să schimbe standardele Interfețe Un sistem computerizat tipic de dimensiuni mici până la mijlocii constă dintr-un cip de procesor, cipuri de memorie și mai multe controlere I/O Toate aceste microcircuite sunt conectate printr-un autobuz Am acoperit deja memoria, procesoarele și autobuzele Acum este timpul să studiem cipurile I/O Prin aceste microcircuite computerul face schimb de informații cu dispozitive externe cipuri I/O În prezent, există multe cipuri I/O diferite Noi microcipuri apar tot timpul Cele mai comune sunt UART, USART, controlere CRT, controlere de disc și RJU Un UART (Universal Asynchronous Receiver Transmitter) este un cip care poate citi un octet din magistrala de date și poate transmite acel octet bit cu bit pe linia serială către sau de la terminal Viteza cipurilor UART este diferită: de la la bps; lățimea caracterelor de la la biți; , , sau biți de oprire Microcircuitul poate oferi paritate pară sau impară, verificarea poate fi și absentă, totul este controlat de software Cipul USART (Universal Synchronous Asynchronous Receiver Transmitter) poate efectua transmisie sincronă folosind o serie de protocoale De asemenea, acceptă toate funcțiile cipului UART Acum, ca exemplu de microcircuit I/O, luați în considerare interfața paralelă Ryu Interfețe Microcircuite PIO Un exemplu tipic de cip de interfață PYU (Intrare/Ieșire paralelă - intrare-ieșire paralelă) este cipul Intel A (Fig ) Conține de linii I/O și poate interfața cu orice dispozitiv compatibil TTL (de exemplu, tastaturi, comutatoare, indicatoare, imprimante) Programul CPU poate scrie sau pe orice linie sau poate citi starea de intrare a oricărei linii, oferind o mare flexibilitate Cipul Ryu înlocuiește adesea întreaga placă cu cipuri MIS și SIS (în special în sistemele încorporate) CPU poate configura cipul A în diferite moduri prin încărcarea registrelor de stare a chipului; ne vom concentra asupra unora dintre modurile de operare mai simple Vă puteți gândi la acest cip ca fiind trei porturi de biți: A, B și C Un registru de biți este asociat fiecărui port Pentru a configura linii pe port, CPU scrie un număr de biți în registrul corespunzător, iar acel număr de biți apare pe liniile de ieșire și rămâne acolo până când registrul este suprascris Pentru a utiliza un port pentru intrare, CPU-ul citește pur și simplu registrul corespunzător Alte moduri de operare includ confirmarea comunicării cu dispozitivele externe De exemplu, pentru a trimite date către un dispozitiv, A ar putea trimite date la un port de ieșire și poate aștepta până când dispozitivul semnalează că datele au fost primite și mai multe pot fi trimise Microcircuitul include circuitele logice necesare pentru fixarea unor astfel de semnale și transmiterea lor către procesorul central Vedem în Fig că, în plus față de de pini pentru trei porturi, cipul A conține opt linii conectate direct la magistrala de date, o linie de selecție a elementelor de memorie, linii de citire și scriere, două linii de adresă și o linie pentru resetarea cipului Două linii de adresă vă permit să selectați unul dintre cele patru registre interne, dintre care trei corespund portului A, B și C Al patrulea registru este registrul de stare Determină ce porturi sunt folosite pentru intrare și ce porturi sunt folosite pentru ieșire și îndeplinește și alte funcții De obicei, cele două linii de adresă sunt conectate la cei doi biți cei mai puțin semnificativi ai magistralei de adrese Capitolul Nivel logic digital Decodificarea adresei Până acum, nu ne-am oprit în detaliu asupra modului în care are loc alegerea unui cip de memorie sau a unui dispozitiv I/O Luați în considerare un computer încorporat simplu de biți, constând dintr-o unitate centrală de procesare, o EPROM de K x octeți pentru stocarea programului, o memorie RAM de K x octeți pentru stocarea datelor și un cip PYU Un astfel de sistem mic poate fi construit într-o jucărie ieftină sau într-un dispozitiv simplu ROM-ul obișnuit poate fi folosit în loc de EPROM Cipul Ryu poate fi accesat în unul din două moduri: ca dispozitiv I/O sau ca o bucată de memorie Dacă avem nevoie de un microcircuit ca dispozitiv I/O, trebuie să ne referim la acesta folosind o linie de magistrală externă O altă abordare se numește I/O mapat în memorie În acest caz, cipul trebuie să aloce octeți de memorie pentru trei porturi și un registru de control Alegerea noastră este oarecum arbitrară Să aruncăm o privire la I/O mapate în memorie, deoarece această abordare ilustrează câteva probleme interesante de asociere Memoria EPROM necesită KB de spațiu de adrese, RAM de asemenea KB, iar cipul Ryu octeți Deoarece spațiul de adrese din exemplul nostru este de K de adrese, trebuie să alegem unde să punem cele trei dispozitive Una dintre opțiunile posibile este prezentată în Fig , EPROM ocupă adrese de până la K, RAM - de la K la K, RYU - octeți înalți ai spațiului de adrese, de la adresele la Din punctul de vedere al programatorului, nu contează ce adrese să folosească, totuși, pentru împerechere are o mare importanță Dacă am accesa RIO prin spațiul I/O, nu am avea nevoie de adrese de memorie (dar am avea nevoie de patru adrese de spațiu I/O) EPROM de la adresa O RAM de la adresa H PIO de la adresa FFFCH Despre K K K K K K K K K K K K K K K K Orez , Locația EPROM, RAM și PIO într-un spațiu de K adrese Cu această alocare de adrese, EPROM-ul trebuie accesat utilizând adresa de memorie de biți OOOOOhhhhhhhhh (în binar) Cu alte cuvinte, orice adresă care are cei mai semnificativi cinci biți de intră în zona de memorie până la K, adică în EPROM Astfel, semnalul de selectare EPROM poate fi conectat la un comparator de biți, care va avea întotdeauna una dintre intrările sale conectată la Pentru a obține același rezultat, ar fi mai bine să folosiți o poartă SAU cu cinci intrări conectate la liniile de adresă An prin A Semnalul de ieșire poate fi dacă și numai dacă toate cele cinci linii sunt În acest caz Interfețe ceai, semnalul CS este setat Din păcate, nu există porți SAU cu cinci intrări în seria MIS standard Cu toate acestea, putem folosi o poartă NOR cu opt intrări Prin împământarea celor trei intrări și inversarea ieșirii, putem obține semnalul de care avem nevoie (Fig , a) Autobuz de adrese - Orez , Decodarea adresei complete (a); decodare parțială a adresei (b) Capitolul Nivel logic digital Schemele MIS sunt foarte ieftine, așa că utilizarea nu foarte eficientă a uneia dintre ele este destul de acceptabilă Prin convenție, intrările neutilizate nu sunt prezentate în diagrame Același principiu poate fi aplicat RAM Cu toate acestea, RAM trebuie să răspundă la adrese binare precum ІОООххххххххх, deci este nevoie de un invertor suplimentar (este prezentat în diagramă) Decodificarea adresei cipului RYU este ceva mai complicată, deoarece este accesată folosind patru adrese precum IXX Un posibil circuit care setează semnalul CS numai dacă o adresă de acest tip apare pe magistrala de adrese este prezentat în figură Utilizează două porți NAND cu opt intrări care sunt conectate la o poartă SAU Pentru a construi schema de decodare a adreselor prezentată în Fig , a, sunt necesare șase cipuri MIS: patru cipuri cu opt intrări, o poartă SAU și un cip cu trei invertoare Dacă computerul constă doar dintr-o unitate centrală de procesare, două cipuri de memorie și un RIO, decodarea adreselor poate fi foarte simplificată Faptul este că pentru toate adresele EPROM (și numai pentru EPROM), cel mai semnificativ bit al A este întotdeauna Prin urmare, putem conecta pur și simplu semnalul CS la linia A , așa cum se arată în Fig b Acum decizia de a plasa RAM de la adresa H nu pare atât de arbitrară Rețineți că adrese precum ІОхххххххххххх intră în RAM, deci biți sunt suficienți pentru decodare De asemenea, orice adresă care începe cu un I este o adresă Ryu Logica de decodare completă constă din două porți NAND și un invertor Deoarece un invertor poate fi realizat dintr-o poartă NAND prin legarea a două intrări împreună, o poartă NAND cvadruplă este mai mult decât suficientă Logica ilustrată în fig b, se numește decodare parțială a adreselor, deoarece în acest caz nu sunt folosite adrese complete Cu această decodare, citirea din adresele și De fapt, orice adresă din jumătatea inferioară a spațiului de adrese înseamnă o selecție EPROM Deoarece nu sunt folosite adrese suplimentare, acesta nu este un lucru groaznic, dar atunci când proiectați un computer care ar trebui să fie extins în viitor (în cazul jucăriilor, acest lucru este puțin probabil), decodificarea parțială ar trebui evitată, deoarece limitează semnificativ spațiul de adrese De asemenea, puteți utiliza o altă tehnologie de decodare a adreselor - folosind un decodor (vezi Figura ) Prin conectarea celor trei intrări la cele trei linii de adresă MSB, obținem opt ieșiri care corespund adreselor din primul segment de K, al doilea segment de K și așa mai departe Într-un computer care conține cipuri RAM de K x octeți, decodare completă realizează un astfel de microcircuit Dacă computerul conține cipuri de memorie de K x octeți, un decodor este, de asemenea, suficient pentru decodare, cu condiția ca fiecare cip de memorie să ocupe o zonă separată a spațiului de adrese de K (Amintiți-vă de observația noastră că locația cipurile de memorie și dispozitivele de intrare sunt scoase în interiorul spațiului de adrese contează ) Întrebări și sarcini Rezumatul capitolului Calculatoarele sunt construite din circuite integrate care conțin întrerupătoare minuscule numite porți Porțile comune sunt AND, OR, NAND, NOR și NOT Prin combinarea supapelor individuale, pot fi construite circuite simple Circuitele mai complexe sunt multiplexoarele, demultiplexoarele, codificatoarele, decodoarele, schimbatoarele și ALU-urile Funcțiile booleene arbitrare pot fi programate folosind matricea logică programabilă Dacă sunt necesare multe funcții booleene, matricele logice programabile sunt de obicei mai eficiente decât alte mijloace Legile algebrei booleene sunt folosite pentru a transforma circuitele dintr-o formă în alta În multe cazuri, pot fi create circuite mai economice în acest fel Operațiile aritmetice în calculatoare sunt efectuate de sumatori Un sumator cu un singur bit poate fi construit din două jumătăți de adunare Pentru a construi un adunator de cuvinte pe mai mulți biți, sumatorii completi sunt conectați astfel încât ieșirea de transport a fiecărui sumator să fie transmisă vecinului său din stânga Memoria statică este formată din zăvoare și flip-flops, fiecare dintre acestea putând stoca câte un bit de informații Acestea pot fi combinate pentru a crea flip-flops și zăvoare de opt biți sau memorie gata de utilizare pentru stocarea cuvintelor Există diferite tipuri de memorie: RAM, ROM, PROM, EPROM, EEPROM, memorie flash RAM statică nu trebuie actualizată: stochează informații în timp ce computerul este pornit RAM dinamică, pe de altă parte, trebuie reîmprospătată periodic pentru a preveni pierderea de informații Componentele unui sistem informatic sunt conectate prin autobuze Majoritatea (deși nu toți) pinii unui procesor tipic formează o singură linie de magistrală Liniile de autobuz pot fi împărțite în adresă, informații și control Autobuzele sincrone sunt conduse de un oscilator principal În magistralele asincrone, un sistem complet de strângere de mână este utilizat pentru a coordona funcționarea dispozitivelor master și slave Pentium este un exemplu de procesor modern Sistemele cu un astfel de procesor includ o magistrală de memorie, o magistrală PCI, o magistrală ISA și o magistrală USB Busul PCI poate transmite de biți de informații simultan la o frecvență de MHz Acest lucru este suficient pentru aproape toate dispozitivele periferice, dar nu și pentru memorie Comutatoarele, indicatoarele, imprimantele și multe alte dispozitive I/O pot fi conectate la un computer folosind cipuri I/O (de exemplu, A) Aceste cipuri pot fi opțional făcute parte din spațiul I/O sau parte din spațiul de memorie Accesul la cip poate avea loc prin decodarea totală sau parțială a adresei, în funcție de sarcinile pe care computerul le rezolvă Întrebări și sarcini Un logician intră cu mașina într-un restaurant și spune: "Dă-mi un hamburger sau un hot dog și cartofi prăjiți, te rog " Din păcate, bucătarul nu a terminat șase clase și nu știe (și nu vrea să știe) care dintre cele două operații logice Capitolul Nivel logic digital Și sau SAU are prioritate față de celălalt El consideră că orice interpretare este acceptabilă în acest caz Și care dintre opțiunile de interpretare a acestei afirmații enumerate aici sunt cu adevărat admisibile? (Rețineți că OR este tratat ca SAU EXCLUSIV aici ) ) Doar un hamburger ) Doar un hot dog ) Doar cartofi prajiti ) Hot dog și cartofi prăjiți ) Hamburger și cartofi prăjiți ) Hot dog și hamburger ) Toate trei ) Nimic - logicianul va rămâne flămând pentru că este prea deștept Un misionar care s-a rătăcit în California de Sud s-a oprit la o bifurcație a drumului Știe că în zonă sunt două bande de motocicliști Unul dintre ei spune mereu adevărul, iar celălalt minte mereu Vrea să știe ce drum duce la Disneyland Ce întrebare ar trebui să pună? Folosind tabelul de adevăr, arată că X = (X ȘI Y) SAU (X ȘI NU Y) Există funcții booleene pentru o variabilă și funcții pentru două variabile Câte funcții a trei variabile există? Și din n variabile? Arată cum poate fi implementată funcția AND folosind două porți NAND Folosind multiplexorul cu trei variabile prezentat în fig , implementați o funcție a cărei valoare este dacă și numai dacă un număr impar de intrări este Multiplexorul cu trei variabile prezentat în fig este de fapt capabil să calculeze o funcție arbitrară a patru variabile booleene Descrieți cum se întâmplă acest lucru și desenați o diagramă logică pentru o funcție care evaluează la dacă cuvântul corespunzător rândului din tabelul de adevăr conține un număr par de litere și dacă conține un număr impar de litere (de exemplu, = zero = patru litere − " ; = două = trei litere - ; = șapte = patru litere - ; = treisprezece = zece litere -> ) Sugestie', să numim a patra variabilă de intrare D Apoi opt linii de intrare pot fi conectate la Vcc, masă, D sau D Desenați diagrama logică a unui encoder pe doi biți care conține linii de intrare și de ieșire Una dintre liniile de intrare este întotdeauna Numărul binar de două cifre de pe cele două linii de ieșire indică care linie de intrare este Desenați diagrama logică a unui demultiplexor pe doi biți în care semnalul de pe o singură linie de intrare este direcționat către una dintre cele patru linii de ieșire, în funcție de valorile celor două linii de control Întrebări și sarcini Redesenați matricea logică programabilă prezentată în fig Arată cum poate fi implementată funcția de majoritate logică pe ea (vezi Figura ) Asigurați-vă că arătați care dintre relațiile potențiale sunt utilizate în prima și a doua matrice I Ce face acest circuit? Un circuit SIS tipic este un sumator de biți Patru astfel de circuite pot fi legate între ele pentru a forma un sumator de biți Câți pini credeți că ar trebui să conțină fiecare sumator de biți? De ce? Un sumator cu n biti se poate obtine prin cascada a n sumatori plini, cu carry to stage r, pe care il vom nota Cr, obtinut din rezultatul calculelor din etapa i - Carry to stage , Co este Dacă calculul sumei și transferului este T ns la fiecare etapă, atunci transferul la etapa i va fi calculat numai după iT ns după începerea însumării Pentru n mare, poate dura foarte mult timp înainte ca transferul la ultima etapă să fie calculat Proiectați un adaos care rulează mai repede Sugestie', fiecare transfer Q poate fi exprimat în termeni de operanzi (biți) D - și - , la fel ca transferul Cr - Folosind această relație, puteți exprima Cr în funcție de semnalele de intrare din stadiu de la la i - , astfel încât toate transferurile să poată fi generate în același timp Dacă toate supapele din fig au o întârziere de tranzit de ns și toate celelalte întârzieri sunt ignorate, cât timp (minimum) este nevoie pentru a obține un semnal de ieșire valid? ALU prezentat în fig este capabil să efectueze adăugarea de numere binare de biți Poate face scăderea binară? Dacă da, vă rugăm să explicați cum Dacă nu, transformați circuitul în așa fel încât să poată scădea O ALU pe biți este asamblată din ALU-uri pe un singur bit, fiecare dintre ele necesită ns pentru a însuma Dacă întârzierea de la o ALU la alta este de ns, cât timp va dura pentru a obține rezultatul final? Uneori este necesar ca o ALU de biți (vezi, de exemplu, Fig ) să scoată o constantă - Sugerați două moduri diferite de a face acest lucru Pentru fiecare metodă, determinați valorile celor șase semnale de control Capitolul Nivel logic digital Care este starea de repaus a intrărilor S și R ale unui latch SR construit din două porți NAND? Schema din fig este un flip-flop care se declanșează pe marginea ascendentă a semnalului de ceas Transformați acest circuit pentru a obține un flip-flop care se declanșează pe marginea de cădere a semnalului de ceas În memoria x prezentată în fig Sunt utilizate porțile , AND și trei porți OR Câte porți din fiecare dintre cele două tipuri vor fi necesare dacă circuitul este extins la o dimensiune de x ? Sfatuiți producătorii de cipuri MIS fără experiență Unul dintre clienții dvs , la cererea unui client potențial important, a propus să producă un cip care să conțină patru D-flip-flops, fiecare dintre ele având ieșiri Q și Q În acest proiect, toate cele semnale de ceas sunt combinate (de asemenea la cererea cumpărătorului) Circuitul nu are intrări presetate și clare Sarcina dumneavoastră este să oferiți o evaluare profesională a acestei dezvoltări Odată cu creșterea cantității de memorie plasată pe un cip, crește și numărul de pini necesari pentru a accesa această memorie A avea un număr mare de pini de adresă pe un cip este destul de incomod Gândiți-vă la o modalitate de a accesa cuvinte de " de memorie când există mai puțini pini decât n Un computer cu o magistrală de date pe de biți utilizează M x RAM dinamică Care este cantitatea minimă de memorie (în octeți) pe care o poate păstra acest computer? Reveniți la diagrama de timp din fig Să presupunem că ați încetinit oscilatorul principal la ns în loc de ns, dar constrângerile de timp au rămas neschimbate Care este cel mai rău caz timp pentru ca memoria să transfere date pe magistrală la momentul T după ce semnalul MREQ este afirmat? Privește din nou la fig Să presupunem că ceasul rulează la MHz și TAD-ul a crescut la ns Mai poți folosi cipuri de memorie de ns? Tabelul arată că valoarea TML ar trebui să fie de cel puțin ns Vă puteți imagina un cip care are acest negativ? Cu alte cuvinte, procesorul poate afirma semnalul MREQ înainte de a afla adresa? Explică de ce Să presupunem că transferul blocului din fig a fost realizat pe autobuz, a cărui diagramă de timp este prezentată în fig Cât de mult mai mult transfer are un transfer de bloc în comparație cu transferurile individuale (pentru blocuri lungi)? Acum să presupunem că lățimea magistralei nu este de , ci de de biți Care va fi răspunsul tău acum? Uită-te la fig Desemnați timpul de transmisie al liniilor de adresă ca TA și TA , timpul de transmisie al liniei MREQ ca TMREq! și TMREq , etc Scrieți toate inegalitățile implicate de strângerea de mână completă Întrebări și sarcini Majoritatea magistralelor pe de biți permit citirea și scrierea în bucăți de biți Există opțiuni pentru unde exact să pun datele? Argument Multe procesoare acceptă un tip special de ciclu de magistrală pentru a confirma o întrerupere De ce este nevoie de asta? Un computer pe de biți cu o magistrală de MHz are nevoie de cicluri pentru a citi un cuvânt de de biți Câtă lățime de bandă a magistralei este consumată de procesor în cel mai rău caz? Un procesor pe de biți cu linii de adresă A -A necesită ca toate referințele de memorie să fie aliniate Aceasta înseamnă că CPU ar trebui să acceseze numai cuvinte formate din , , , etc octeți (numărul de octeți este un multiplu de ) și jumătate de cuvinte formate dintr-un număr par de octeți Octeții pot fi oriunde Câte combinații posibile de operații de citire a memoriei există și câți pini sunt necesari pentru a le implementa? Dă două răspunsuri De ce nu poate funcționa procesorul Pentium cu o magistrală PCI pe de biți fără a degrada funcționalitatea? La urma urmei, alte computere cu o magistrală pe de biți pot transfera , și chiar biți Să presupunem că CPU conține memorie cache de primul și al doilea nivel cu un timp de acces de ns și, respectiv, ns Timpul de acces la memoria principală este de ns Dacă % din toate accesările la memorie sunt în memoria cache L și % sunt în memoria cache L , care este timpul mediu de acces? Poate un sistem încorporat să conţină un cip A? Calculați lățimea de bandă a magistralei necesară pentru afișarea unui film color ( fps) pe un monitor VGA ( x ) Se presupune că datele trebuie să treacă prin magistrală de două ori: o dată - de la CD în memorie, a doua - de la memorie la monitor Care semnal Pentium crezi că setează semnalul FRAME# pe magistrala PCI? Care dintre semnalele prezentate în fig nu sunt obligatorii pentru protocolul autobuzului? Debitul total al tuturor canalelor din PCI Express este de MB/s Câte fire de semnal în fiecare direcție ar fi necesare pentru a rula la viteza de x? Care va fi debitul total în fiecare direcție? Lățime de bandă utilă în fiecare direcție? Calculatorul are nevoie de două cicluri de magistrală pentru a executa fiecare comandă: unul pentru a apela comanda, al doilea pentru a apela datele Fiecare ciclu de magistrală durează ns, iar fiecare instrucțiune durează ns pentru a se executa (timpul de procesare nu este luat în considerare) Computerul are un disc Fiecare pistă a acestui disc constă din de sectoare de octeți Timpul de rotație a discului este de ms Cu ce procent se reduce viteza Capitolul Nivel logic digital computer în cazul accesului direct la memorie, dacă fiecare operare pe de biți a unui astfel de acces durează un ciclu de magistrală? Sarcina maximă a unui pachet de date USB este de de octeți Presupunând că un dispozitiv poate trimite doar un pachet de date pe cadru, care este debitul maxim pentru un singur dispozitiv izocron? Uită-te la fig b Ce se întâmplă dacă adăugăm o a treia linie de intrare conectată la A la poarta NAND, care vă permite să selectați cipul RYU? Scrieți un program care simulează funcționarea unei matrice m x n formată din porți NAND cu două intrări Acest circuit (este plasat pe un cip) conține j pini de intrare și k de ieșire Valorile / k, tip sunt procesate în timpul compilării Programul citește tabelul conexiunilor de câmp, fiecare conexiune definește o intrare și o ieșire Intrarea poate fi fie unul dintre pinii de intrare j, fie ieșirea unei porți NAND Ieșirea poate fi fie una dintre cele k terminale de ieșire, fie o intrare către o poartă NAND Intrările neutilizate iau valoarea unei unități logice După citirea tabelului de conexiuni, programul trebuie să imprime o valoare de ieșire pentru fiecare dintre cele > valori de intrare posibile Astfel de rețele de porți sunt utilizate pe scară largă atunci când desenează circuite conform specificațiilor clientului, deoarece cea mai mare parte a acestei lucrări (adică aplicarea unei matrice de porți la un microcircuit) nu depinde de ce fel de circuit va fi Pentru fiecare dezvoltare contează doar alegerea conexiunilor de teren Scrieți un program care ia ca intrare două expresii logice arbitrare și verifică dacă reprezintă aceeași funcție Limbajul de introducere trebuie să includă litere simple (variabile booleene), operanzi AND, OR și NOT și paranteze Fiecare expresie trebuie să se încadreze pe o linie de intrare Programul calculează tabele de adevăr pentru ambele funcții și le compară Scrieți un program care ia o serie de expresii logice ca intrare și construiește matricele de x și x care sunt necesare pentru a implementa aceste expresii în matricea logică programabilă prezentată în fig Limba de intrare este aceeași ca în sarcina anterioară Imprimați aceste matrice pe o imprimantă de linie capitolul nivelul microarhitecturii Deasupra nivelului logic digital este nivelul microarhitecturii Sarcina sa este de a interpreta comenzile de Nivel (arhitectura comenzilor), așa cum se arată în Figura Structura nivelului de microarhitectură depinde de nivelul arhitecturii de instrucțiuni, precum și de costul și scopul computerului În prezent, la nivelul arhitecturii de instrucțiuni, există de obicei instrucțiuni simple care sunt executate într-un singur ciclu (cum ar fi, în special, mașinile RISC) Alte sisteme (cum ar fi Pentium ) au comenzi mai complexe la acest nivel; executarea unei astfel de comenzi durează mai multe cicluri Pentru a executa o instrucțiune, trebuie să găsiți operanzii în memorie, să-i citiți și să scrieți rezultatele înapoi în memorie Managementul nivelului de comandă cu comenzi complexe diferă de managementul nivelului de comandă cu comenzi simple, deoarece în primul caz, executarea unei comenzi necesită o anumită secvență de operații Exemplu de microarhitectură În mod ideal, ar fi bine să descriem mai întâi principiile generale ale dezvoltării la nivel de microarhitectură, dar, din păcate, astfel de principii generale nu există Fiecare dezvoltare este individuală Din acest motiv, ne vom uita doar la un exemplu specific în detaliu Ca exemplu, am ales un subset al mașinii virtuale Java Acest subset conține doar instrucțiuni întregi, așa că l-am numit IJVM (Integer Java Virtual Machine - Java Virtual Machine for Integers) Vom acoperi întreaga mașină virtuală (JVM) în Capitolul Vom începe prin a descrie microarhitectura pe care vom implementa IJVM IJVM conține câteva comenzi destul de complexe După cum sa menționat în Capitolul , aceste arhitecturi sunt adesea implementate prin microprogramare Deși structura IJVM nu este excesiv de complexă, poate fi un bun punct de plecare pentru a descrie principiile de bază ale procesării comenzilor și ordinea în care sunt executate Microarhitectura noastră conține firmware (în ROM) care trebuie să apeleze, să decodeze și să execute comenzi IJVM Nu putem folosi interpretul JVM de la Sun pentru acest firmware, deoarece avem nevoie doar de un firmware mic care rulează porți hardware individuale Interpretul JVM de la Sun este scris în C pentru a asigura portabilitatea software-ului Acest interpret nu poate gestiona hardware-ul la nivelul granular de care avem nevoie Deoarece hardware-ul real constă numai din componente, Capitolul Stratul de microarhitectură descris în Capitolul , teoretic, după ce a citit acest capitol, cititorul ar trebui să poată merge la un magazin, să cumpere o grămadă de tranzistori și să construiască o mașină IJVM Celor care îndeplinesc cu succes această sarcină li se va acorda credit suplimentar (precum și o evaluare psihiatrică completă) Să fim de acord să considerăm fiecare comandă a nivelului arhitecturii comenzii ca o funcție numită din programul principal În acest caz, programul principal este destul de simplu Este un ciclu nesfârșit Mai întâi, programul determină ce funcție să execute, apoi apelează această funcție, după care totul se repetă din nou Firmware-ul conține un set de variabile la care au acces toate funcțiile Acest set de variabile se numește starea computerului Fiecare funcție modifică cel puțin câteva variabile în timp ce generează o stare nouă De exemplu, contorul de programe este parte a statului Specifică locația următoarei funcții (adică instrucțiunea la nivel de arhitectură a instrucțiunii) care urmează să fie executată În timpul execuției fiecărei instrucțiuni, contorul de instrucțiuni indică următoarea instrucțiune Comenzile IJVM sunt foarte scurte Fiecare comandă constă din mai multe câmpuri, de obicei unul sau două, fiecare dintre ele rezolvă o problemă specifică Primul câmp conține codul de operare Acest cod specifică tipul de comandă (de exemplu, adăugare, ramură sau altă comandă) Multe instrucțiuni conțin un câmp suplimentar care specifică tipul operandului De exemplu, comenzile care accesează variabile locale ar trebui să aibă un câmp special pentru a identifica ce variabilă este Acest model de execuție a instrucțiunilor, denumit uneori bucla fetch-execute, este util pentru teorie și poate forma baza pentru implementarea unui strat de arhitectură de instrucțiuni cu instrucțiuni complexe (de exemplu, IJVM) În continuare, descriem cum funcționează acest model, ce este microarhitectura și cum este controlată de microinstrucțiuni, fiecare dintre acestea ocupând o cale de date pentru un ciclu Lista completă de comenzi formează firmware-ul, care va fi discutat în detaliu Calea datelor Calea datelor este o parte a unității centrale de procesare, constând din ALU (unitatea logică aritmetică), intrările și ieșirile sale Calea de date a microarhitecturii noastre este prezentată în Fig Deși această cale de date a fost optimizată pentru interpretarea programelor IJVM, este similară cu căile de date ale majorității computerelor Calea conține un număr de registre pe de biți, cărora le-am atribuit nume simbolice (de exemplu, PC, SP, MDR) Deși unele dintre aceste nume ne sunt familiare, este important să înțelegem că aceste registre sunt disponibile doar la nivel de microarhitectură (pentru firmware) Li se dau aceste nume pentru că de obicei conțin valori corespunzătoare variabilelor numite similar la nivelul arhitecturii instrucțiunilor Conținutul majorității registrelor este trimis către magistrala B Ieșirea ALU controlează circuitul de deplasare și apoi magistrala C Valoarea din magistrala C poate fi scrisă în unul sau mai multe registre în același timp Vom introduce autobuzul A mai târziu, dar deocamdată ne vom imagina că nu există Exemplu de microarhitectură Orez Calea datelor pentru microarhitectura tratată în acest capitol Acest ALU este identic cu cel prezentat în Fig și Funcționarea sa depinde de liniile de control Pe fig o săgeată încrucișată cu numărul deasupra indică prezența a șase linii de control ALU Dintre acestea, Fo și Fj sunt folosite pentru a seta operația, ENA și ENB pentru a permite semnalelor de intrare A și B, respectiv, INVA pentru a inversa intrarea din stânga și INC pentru a transfera bitul la bitul cel mai puțin semnificativ, ceea ce este echivalent cu adăugarea Capitolul Stratul de microarhitectură unități la rezultat Cu toate acestea, nu toate cele de combinații de valori de pe liniile de control pot fi utile Unele combinații sunt prezentate în tabel Nu toate aceste caracteristici sunt necesare pentru o mașină IJVM, dar multe dintre ele pot fi utile pentru o mașină cu funcții complete (JVM) În cele mai multe cazuri, există mai multe posibilități de a obține același rezultat În acest tabel, semnul plus (+) înseamnă plus aritmetic, iar semnul minus (-) înseamnă minus aritmetic, deci -A înseamnă complementul lui A Tabelul Unele combinații de semnale ALU și funcțiile lor corespunzătoare Număr de ordine Fo F, ENA ENB INVA INC Funcție A V V A+ B A+ B + A+ B + B - A V - -A AIV A SAU B - ALU prezentat în fig conține două intrări de date: intrarea din stânga (A) și intrarea din dreapta (B) Intrarea din stânga este conectată la registrul de reținere H Intrarea din dreapta este conectată la magistrala B, care poate primi valori de la una dintre cele nouă surse, așa cum este indicat de cele nouă săgeți gri adiacente magistralei Există o altă dezvoltare a ALU cu două autobuze full-size, o vom privi puțin mai târziu în acest capitol Registrul H poate primi o funcție ALU care trece prin intrarea dreaptă (de la magistrala B) către ieșirea ALU O astfel de funcție este adăugarea intrărilor ALU, numai atunci când semnalul ENA este negativ și intrarea din stânga este setată la Adăugarea lui la valoarea magistralei B nu modifică valoarea Rezultatul este apoi trecut prin circuitul de schimbare (de asemenea, neschimbat) și stocat în registrul H Exemplu de microarhitectură Mai sunt două linii de control care sunt utilizate independent de celelalte Acestea servesc la controlul ieșirii ALU Linia SLL (Shift Left Logical - deplasare logică la stânga) mută numărul la stânga cu octet, umplând cei biți cei mai puțin semnificativi cu zerouri Linia SRA (Shift Right Arith-metic - deplasare aritmetică la dreapta) mută numărul la dreapta cu bit, lăsând neschimbată cea mai semnificativă cifră binară Este posibil să citiți și să scrieți același registru într-un singur ciclu Pentru a face acest lucru, de exemplu, trebuie să puneți valoarea SP pe magistrala B, să închideți intrarea din stânga a ALU, să setați semnalul INC și să stocați rezultatul în registrul SP, crescând astfel valoarea cu (vezi linia ) în tabelul ) Dacă același registru poate fi citit și scris într-un singur ciclu, atunci cum puteți preveni apariția datelor inutile? Faptul este că procesele de citire și scriere au loc în diferite părți ale ciclului Când unul dintre registre este selectat ca intrare dreaptă a ALU, valoarea sa este plasată pe magistrala B la începutul ciclului și stocată acolo pe tot parcursul ciclului Apoi, ALU își îndeplinește activitatea, rezultatul căruia este transmis prin circuitul de schimbare la magistrala C Cu puțin timp înainte de sfârșitul ciclului, când valorile de ieșire ale ALU și ale circuitului de schimbare se stabilizează, conținutul C magistrala sunt transferate la unul sau mai multe registre Unul dintre aceste registre poate fi foarte bine cel de la care a fost semnalată magistrala B Timpul precis al căii de date face posibilă citirea și scrierea aceluiași registru într-un singur ciclu Acest lucru va fi discutat în continuare Sincronizarea căilor de date Modul în care sunt sincronizate aceste acțiuni este prezentat în Fig Aici, la începutul fiecărui ciclu, este generat un impuls scurt Poate fi emis de un oscilator principal, așa cum se arată în Fig , c La scăderea pulsului, sunt setați biții care vor declanșa toate porțile Acest proces durează o anumită perioadă de timp în Iad Apoi se selectează un registru și valoarea acestuia este transferată pe magistrala B Acest lucru durează Ar Mai mult, ALU și circuitul de schimbare încep să funcționeze cu datele primite de ei După intervalul Δt/, semnalele de ieșire ale ALU și ale circuitelor de schimbare se stabilizează În timpul următorului segment, Ar, rezultatele trec de-a lungul magistralei C către registre, unde sunt încărcate pe marginea următorului impuls Sarcina trebuie să fie declanșată de margine și instantanee, astfel încât, chiar dacă oricare dintre registrele de intrare este schimbat, magistrala C nu se va schimba până când registrele sunt complet încărcate La marginea pulsului, registrul care declanșează magistrala B se oprește și așteaptă următorul ciclu În figură, există și registre MPC și MIR, precum și memorie Vom discuta despre scopul lor puțin mai târziu Este important să înțelegeți că, deși nu există elemente de stocare în calea datelor, este nevoie de o anumită perioadă de timp pentru ca un semnal să traverseze aceasta Modificarea valorii pe magistrala B provoacă modificări pe magistrala C nu imediat, ci numai după o pauză (acest lucru se datorează întârzierilor la fiecare pas) Prin urmare, chiar dacă unul dintre registrele de intrare se modifică, noua valoare este stocată în registru cu mult înainte ca valoarea veche (și deja incorectă) a acelui registru plasată pe magistrala B să poată ajunge la ALU Capitolul Stratul de microarhitectură Registrele sunt încărcate din magistrala C și din memorie pe marginea semnalului de ceas Ciclul Semnal de ieșire Aw Du i Az Iată noua valoare a MRS folosit pentru a încărca o nouă microinstrucțiune în registrul MIR eu Setarea semnalelor pentru a începe calea datelor ALU și circuit de schimbare Registrul MPS este disponibil aici Registrul H Promotor și semnalul magistralei B de la circuitul de schimbare la registre Orez Timpul ciclului căii datelor Un astfel de sistem necesită o sincronizare strânsă și un ciclu destul de lung; trebuie cunoscut timpul minim de tranzit al semnalului prin ALU; registrele trebuie încărcate din magistrala C foarte repede Dacă abordați această problemă cu suficientă atenție, vă puteți asigura că calea datelor funcționează corect Ciclul căii de date poate fi împărțit în subcicluri Începutul sub-cadrului inițiază un semnal de ceas în scădere Următoarele arată ce se întâmplă în timpul fiecărui sub-ciclu Mărimea subciclului este dată în paranteze Semnalele de control (Aw) sunt setate Valorile registrului sunt încărcate pe magistrala B (Ax) ALU și circuitele de schimbare (Ar/) funcționează Rezultatele sunt transmise pe magistrala C înapoi la registre (Az) La marginea următorului ciclu, rezultatele sunt stocate în registre Nu există semnale externe care să indice începutul și sfârșitul subciclului și să spună ALU când să pornească și să trimită rezultatele către magistrala C În realitate, ALU și circuitele de schimbare a treptelor funcționează în mod constant Cu toate acestea, intrările lor sunt invalide în perioada Aw + Ax În mod similar, semnalele lor de ieșire sunt invalide în perioada Aw + Ax + Ar/ Singurele semnale externe care controlează calea datelor sunt semnalul de ceas descendent, care începe ciclul căii de date, și frontul ascendent al semnalului de ceas, care inițiază încărcarea registrelor din magistrala C Limitele sub-cadrelor sunt determinate numai de timpul de tranzit al semnalului, astfel încât proiectanții de căi de date trebuie să calculeze totul cu mare atenție Exemplu de microarhitectură Funcția de memorie Mașina noastră poate interacționa cu memoria în două moduri: printr-un port cu adresa de cuvânt ( de biți) și printr-un port cu adresa de octeți ( biți) Portul adresat cuvântului este controlat de două registre: MAR (Registrul de adresă de memorie) și MDR (Registrul de date de memorie), care sunt prezentate în Fig Portul cu adresa de octet este controlat de registrul PC, care scrie octet în cei biți cei mai puțin semnificativi ai registrului MBR (Memory Buffer Register) Acest port poate citi date din memorie, dar nu poate scrie date în memorie Fiecare dintre aceste registre, precum și toate celelalte registre prezentate în Fig sunt declanșate de unul dintre semnalele de control Săgeata albă de sub registru indică un semnal de control care permite trimiterea ieșirii registrului către magistrala B Registrul MAR nu este conectat la magistrala B, deci nu are un semnal de control de activare Nici registrul H nu are acest semnal, deoarece este singura intrare din stânga posibilă a ALU și, prin urmare, este întotdeauna activată Săgeata neagră de sub registru indică un semnal de control care scrie (adică încarcă) registrul din magistrala C Deoarece registrul MBR nu poate fi încărcat din magistrala C, nu are un semnal de control de scriere (dar are două activare) semnale, care vor fi discutate mai târziu) Pentru a iniția procesul de citire din memorie sau de scriere în memorie, trebuie să încărcați registrele de memorie corespunzătoare și apoi să trimiteți un semnal de citire sau scriere în memorie (nu este prezentat în Fig ) Registrul MAR conține adrese de cuvinte, astfel încât valorile , , etc indică cuvinte succesive Registrul PC conține adrese de octeți, astfel încât valorile , , etc indică octeți consecutivi Dacă valoarea este plasată în registrul PC și procesul de citire este pornit, atunci octetul este citit din memorie, care va fi apoi scris în cei biți cei mai puțin semnificativi ai registrului MBR Dacă valoarea este plasată în registrul MAR și procesul de citire este pornit, atunci octeții de la la (adică cuvântul ) sunt citiți din memorie, care vor fi apoi scrisi în registrul MDR De ce a fost nevoie de două registre cu adresare diferită? Faptul este că registrele MAR și PC sunt necesare pentru a accesa două zone de memorie diferite și de ce este nevoie de acest lucru va deveni clar puțin mai târziu Deocamdată, este suficient să spunem că registrele MAR și MDR sunt folosite pentru a citi și scrie cuvinte de date la nivelul arhitecturii instrucțiunilor, iar registrele PC și MBR sunt folosite pentru a citi programul la nivel de arhitectură a instrucțiunilor, care constă dintr-un flux de octeți În toate celelalte registre care conțin adrese, se aplică principiul adresării cuvintelor, ca în MAR În realitate, există doar un singur octet de memorie adresată Cum accesează registrul MAR cuvintele dacă memoria este formată din octeți? Când o valoare de registru MAR este plasată pe magistrala de adrese, cei de biți ai acelei valori nu se potrivesc exact pe cele de linii de adresă (de la la ) În schimb, bitul este conectat la linia de adresă , bitul unu este conectat la linia de adresă și așa mai departe Cei doi biți cei mai semnificativi nu sunt luați în considerare deoarece sunt necesari doar pentru adresele peste și astfel de adrese nu sunt permise în aparatul nostru de GB Când valoarea MAR este , Capitolul Stratul de microarhitectură adresa este plasată în autobuz; când valoarea MAR este , adresa este plasată pe autobuz și așa mai departe Registrul MAR pe de biți (numărătoare în cuvinte) Nu se ține cont magistrală de adrese pe de biți (numărate în octeți) Orez Atribuirea biților în registrul MAR în magistrala de adrese După cum sa menționat deja, datele citite din memorie printr-un port de biți sunt stocate într-un MBR de biți Acest registru poate fi copiat pe magistrala B în două moduri: semnat și nesemnat Când este necesară o valoare fără semn, cuvântul de de biți plasat pe magistrala B conține valoarea MBR în cei biți inferiori și zerouri în restul de de biți Valorile nesemnate sunt necesare pentru a indexa tabelele sau pentru a obține un număr întreg de biți din doi octeți consecutivi (nesemnati) în fluxul de comandă O altă modalitate de a transforma un MBR de biți într-un cuvânt de de biți este de a-l trata ca o valoare cu semn între - și + inclusiv și de a utiliza această valoare pentru a genera un cuvânt de de biți cu aceeași valoare numerică Această conversie se face prin duplicarea bitului de semn (cel mai din stânga) al MBR în pozițiile de sus de biți ale magistralei B Acest proces se numește extindere a semnului sau extindere a semnului Dacă această opțiune este selectată, atunci fie toți cei de biți superiori vor fi setați la , fie toți vor fi setați la , în funcție de faptul că bitul din stânga MBR este sau În ce valoare de de biți (semnată sau nesemnată) se va transforma valoarea de biți a registrului MBR este determinată de care dintre cele două semnale de control (două săgeți albe sub registrul MBR din Fig ) este setat Caseta punctată din figură arată capacitatea MBR de biți de a acționa ca o sursă de cuvinte de de biți pentru magistrala B Microinstrucțiuni Pentru a gestiona calea datelor prezentată în Fig , avem nevoie de de semnale Ele pot fi împărțite în cinci grupe funcționale: + semnale pentru scrierea datelor din magistrala C în registre; + semnale pentru a permite transferul de registre pe magistrala Viv ALU; Exemplu de microarhitectură ♦ semnale pentru controlul ALU și circuitul de schimbare; ♦ semnale care indică faptul că este necesară citirea sau scrierea prin registrele MAR/MDR (nu sunt prezentate în figură); + semnal, care indică faptul că un apel de memorie trebuie efectuat prin registrele PC / MBR (nu este prezentat și în figură) Valorile acestor de semnale de control determină operațiile pentru un ciclu al căii de date Ciclul constă în transferul valorilor registrelor către magistrala B, trecerea acestor semnale prin ALU și circuitul de deplasare, transferarea rezultatelor în magistrala C și scrierea acestora în registrul dorit (registre) În plus, dacă semnalul de date citite este setat, atunci la sfârșitul ciclului, după ce registrul MAR este încărcat, memoria începe să funcționeze Datele din memorie sunt plasate în MBR sau MDR la sfârșitul următorului ciclu, iar aceste date pot fi utilizate în ciclul care urmează Cu alte cuvinte, dacă citirea din memorie prin oricare dintre porturi începe la sfârșitul ciclului k, atunci datele primite nu pot fi utilizate în ciclul k + (doar în ciclul k + și mai târziu) Acest proces este ilustrat în Fig Semnalele de control al memoriei sunt emise numai după încărcarea registrelor MAR și PC, care are loc pe marginea semnalului de ceas cu puțin timp înainte de sfârșitul ciclului Vom presupune că memoria pune rezultatele pe magistrala de memorie pe parcursul unui ciclu , astfel încât registrele MBR și/sau MDR pot fi încărcate pe următorul front împreună cu alte registre Cu alte cuvinte, încărcăm registrul MAR la sfârșitul ciclului căii de date și inițiază memoria imediat după Prin urmare, nu ne putem aștepta ca rezultatele citite să fie în registrul MDR la începutul următorului ciclu, mai ales dacă lățimea impulsului este scurtă Acest timp nu va fi suficient Prin urmare, trebuie plasat un ciclu între începerea citirii din memorie și utilizarea rezultatului obținut Cu toate acestea, în timpul acestui ciclu, nu numai transferul unui cuvânt din memorie, ci și alte operații pot fi efectuate Presupunând că memoria rulează pentru un ciclu este echivalent cu a presupune o rată de accesare a cache-ului (accesări reușite în cache) de % O astfel de presupunere nu poate fi niciodată adevărată, dar nu vom vorbi aici despre bucle de memorie cu lungime variabilă, deoarece acesta nu este subiectul cărții Deoarece registrele MBR și MDR sunt încărcate pe marginea semnalului de ceas împreună cu alte registre, acestea pot fi citite în timpul ciclurilor în care un cuvânt nou este transferat din memorie Ei returnează valorile vechi pentru că nu a trecut suficient timp pentru ca acestea să fie înlocuite cu cele noi Nu există nicio ambiguitate aici: până când noile valori sunt încărcate în registrele MBR și MDR pe marginea ascendentă, valorile anterioare sunt acolo și pot fi utilizate Rețineți că operațiile de citire pot avea loc una după alta, adică în două cicluri consecutive (deoarece procesul de citire în sine durează doar un ciclu) În plus, ambele amintiri pot funcționa în același timp Cu toate acestea, încercarea de a citi și de a scrie același octet în același timp produce rezultate nedefinite Capitolul Stratul de microarhitectură Ieșirea magistralei C poate fi scrisă în mai multe registre simultan, dar nu este de dorit să se trimită mai mult de un registru către magistrala B Cu puțină circuite, putem reduce numărul de biți necesari pentru a selecta una dintre sursele posibile magistrala B Există doar registre de intrare, care pot porni magistrala B (MBR-urile semnate și nesemnate sunt numărate separat) Prin urmare, putem codifica informațiile pentru magistrala B în biți și folosim decodorul pentru a genera semnale de control, dintre care nu sunt necesare (modelatorii comerciali ar putea dori să scape de unul dintre registre pentru a se descurca cu trei biți, dar noi, ca oameni de știință, preferăm să avem un pic în plus, dar totuși obținem o construcție mai înțeleasă) Acum putem controla calea datelor cu + + + + = de semnale, deci avem nevoie de de biți Cu toate acestea, acești de biți controlează calea datelor doar pentru un ciclu Sarcina managementului este de a determina ce trebuie făcut în următorul ciclu Pentru a ține cont de acest lucru în proiectarea controlerului, vom crea un format pentru descrierea operațiunilor care trebuie efectuate folosind de biți de control și două câmpuri suplimentare: câmpul NEXT ADDRESS (următoarea adresă) și câmpul JAM Conținutul fiecăruia dintre aceste câmpuri va fi discutat mai târziu Pe fig arată unul dintre formatele posibile Conține următoarele grupuri care conțin de semnale: ♦ Adresa - adresa urmatoarei microinstructiuni potentiale; ♦ JAM - determină cum este selectată următoarea microinstrucțiune; ♦ ALU - funcții ALU și circuite de schimbare a treptelor; ♦ C - selectarea registrelor care sunt scrise din magistrala C; ♦ Met - funcții de memorie; ♦ B - selecția sursei pentru magistrala B (cum este codificată, a fost arătat mai devreme) Biți NEXT ADDRESS J M P C J A M NJ A M ZSLL SR A Fo Fi E N A E N B INV A IN C O R S t o S c p p LVS p p c m DR M A RWRI T E R E A DF E T C n Bar B Adr JAM ALU C Met B Registrele autobuzului B O-MDR - RS -MBR -MBRU -SP -LV - CRR -TOS -ORS - - nr Orez Format de microinstrucțiuni pentru Міс- Ordinea grupurilor este, în principiu, arbitrară, deși am ales-o lung și cu grijă pentru a evita intersecțiile din diagrama prezentată în Fig De Exemplu de microarhitectură Astfel de încrucișări pe diagrame corespund adesea încrucișărilor de fire pe circuite integrate Ele fac dezvoltarea mult mai dificilă și cel mai bine sunt menținute la minimum Semnale de gestionare a memoriei (rd, wr, fetch) Orez Diagrama completă a microarhitecturii Mіs- Managementul microinstructiunilor - microarhitectura Mis- Până acum, am vorbit despre controlul căii de date și nu am atins problema ce semnal de control și pe ce ciclu ar trebui setat Pentru a face acest lucru, există un controler de secvență, care este responsabil pentru secvența operațiunilor necesare pentru a executa o comandă Capitolul Stratul de microarhitectură Sequencerul ar trebui să scoată următoarele informații la fiecare ciclu: ♦ starea fiecărui semnal de control din sistem; ♦ adresa microinstrucțiunii care urmează să fie executată Figura este o diagramă detaliată a microarhitecturii complete a mașinii noastre, pe care am numit-o Mis- Deși la prima vedere poate părea impresionant, trebuie studiat în detaliu Dacă înțelegeți toate blocurile și relațiile lor prezentate în această figură, vă va fi mai ușor să înțelegeți structura nivelului de microarhitectură Diagrama constă din două părți: calea datelor (stânga), despre care am discutat deja în detaliu, și blocul de control (dreapta), pe care îl vom lua în considerare acum Cea mai mare și mai importantă parte a unității de control este memoria de control Este convenabil să ne gândim la ea ca la o memorie care stochează tot firmware-ul, deși uneori firmware-ul este implementat ca un set de porți logice Ne vom referi la ea ca memorie de control pentru a nu fi confundată cu memoria principală, care este accesată prin registrele MBR și MDR Din punct de vedere funcțional, memoria de control este o memorie care stochează micro-instrucțiuni în loc de instrucțiuni obișnuite În exemplul nostru, conține cuvinte; fiecare cuvânt este format dintr-o microinstrucțiune de de biți, al cărei format este prezentat în Fig Nu toate aceste cuvinte sunt de fapt necesare, dar din mai multe motive avem nevoie de adrese pentru cuvinte individuale Memoria de control diferă de memoria principală prin aceea că instrucțiunile stocate în memoria principală sunt executate în funcție de adresele lor (cu excepția ramurilor), în timp ce microinstrucțiunile nu sunt Creșterea contorului programului din Listatul înseamnă că instrucțiunea care va fi executată după cea curentă se află după aceasta în memorie Microprogramele ar trebui să fie mai flexibile, deoarece secvențele de microinstrucțiuni sunt de obicei scurte și nu au această proprietate În schimb, fiecare microinstrucțiune în sine indică către următoarea microinstrucțiune Deoarece memoria de control este funcțional ROM, are nevoie de propriul registru de adrese și de date Nu necesită semnale de citire și scriere deoarece procesul de citire este în desfășurare Vom apela registrul de adrese al memoriei de control MPC (MicroProgram Counter - microprogram counter) Numele nu este foarte potrivit, deoarece firmware-ul nu este ordonat în mod explicit, iar conceptul de contor este nepotrivit aici, dar nu putem merge împotriva tradiției Vom numi registrul de date MIR (Місго-Instruction Register - microinstruction register) Conține microinstrucțiunea curentă, ai cărui biți declanșează semnale de control care afectează funcționarea căii de date Registrul MIR prezentat în fig conține aceleași șase grupuri de semnale așa cum se arată în fig Grupurile Addr și J (la fel ca JAM) controlează selecția următoarei microinstrucțiuni Le vom discuta puțin mai târziu Grupul ALU conține biți care vă permit să selectați funcția ALU și să porniți circuitul de schimbare Biții C încarcă registre individuale din magistrala C Semnalele M controlează funcționarea memoriei Exemplu de microarhitectură În cele din urmă, ultimii biți pornesc decodorul, care determină ce valoare a registrului va fi trimisă magistralei B În acest caz, am ales un decodor cu intrări și ieșiri, deși există doar registre diferite Un model mai elaborat ar putea folosi un decodor cu intrări și ieșiri Folosim schema standard pentru a nu dezvolta propria noastră schemă Este mult mai ușor să utilizați schema standard și, în plus, veți putea evita greșelile Propriul cip va ocupa mai puțin spațiu, dar va dura destul de mult timp pentru a se dezvolta și este posibil să nu îl construiți corect Schema prezentată în fig funcționează așa La începutul fiecărui ciclu (fața semnalului de ceas din Fig ), un cuvânt este încărcat în registrul MIR din memoria de control, care în figură este marcat cu literele MPC Încărcarea registrului MIR durează o perioadă, adică primul subciclu (vezi Figura ) Când o microinstrucțiune intră în MIR, diferite semnale intră pe calea datelor Valoarea unui anumit registru este plasată pe magistrala B, iar ALU știe ce operație să efectueze Toate acestea se întâmplă în timpul celui de-al doilea subciclu După o perioadă de + Ax, semnalele de intrare ALU se stabilizează După perioada Ag/, semnalele N și Z ale ALU, precum și semnalul de ieșire al circuitului de schimbare, se stabilizează Valorile N și Z sunt apoi stocate în două bistabile cu un singur bit Acești biți, precum și biții tuturor registrelor care sunt încărcate din magistrala C și din memorie, sunt stocați pe marginea semnalului de ceas, aproape de sfârșitul ciclului căii de date Ieșirea ALU nu este stocată, ci pur și simplu transmisă circuitului de schimbare Funcționarea ALU și a circuitelor de schimbare are loc în timpul subciclului După următorul interval, Az, ieșirea schimbătorului, care trece prin magistrala C, ajunge în registre Registrele sunt încărcate la sfârșitul ciclului pe frontul ascendent al semnalului de ceas (vezi Figura ) În timpul subciclului , sunt încărcate registre și flip-flops N și Z Subciclul se termină imediat după sfârșitul muchiei, când toate valorile sunt salvate, rezultatele operațiunilor anterioare de memorie sunt disponibile, registrul MPC este încărcat Acest proces continuă din nou și din nou până când opriți computerul Nu numai că microprogramul trebuie să gestioneze calea datelor, dar trebuie și să determine ce microinstrucțiune trebuie executată în continuare, deoarece microprogramele nu sunt organizate în memoria de control Calculul adresei următoarei microinstrucțiuni începe după ce registrul MIR este încărcat Mai întâi, câmpul NEXT ADDRESS de biți (următoarea adresă) este copiat în registrul MPC În timp ce copia este în curs, câmpul JAM este verificat Dacă conține valoarea OOO, atunci nu trebuie făcut nimic altceva, iar când copia câmpului NEXT ADDRESS este completă, registrul MPC va indica următoarea microinstrucțiune Dacă unul sau mai mulți biți din câmpul JAM sunt , atunci este necesară o acțiune suplimentară Dacă bitul JAMN este , atunci flip-flop N este OR la bitul înalt al registrului MPC Dacă bitul JAMZ este , atunci flip-flop-ul Z este OR la bitul înalt al registrului MPC Dacă ambii biți sunt , ambii sunt OR la același bit Acum să explicăm de ce sunt necesare flip-flops N și Z Faptul este că după marginea semnalului (și până la cădere), magistrala B nu mai pornește, așa că semnalele de ieșire ale ALU nu mai pot fi considerate corecte Stocarea steagurilor de stare ALU în registre Capitolul Stratul de microarhitectură N și Z fac ca valorile corecte să fie stabile și disponibile pentru calculul MPC, indiferent de ce se întâmplă în jurul ALU Pe fig , blocul care efectuează acest calcul este etichetat "Most Bit" Evaluează următoarea funcție booleană: F = ((JAMZ ȘI Z) SAU (JAMN ȘI N)) SAU NEXT ADDRESS[ ] Rețineți că, în orice caz, registrul MPC poate lua doar una dintre cele două valori posibile: Valoarea NEXTADDRESS Valoarea lui NEXT ADDRESS cu cel mai semnificativ bit OR este transformată în unul logic Nu există alte valori Dacă MSB-ul valorii NEXT ADDRESS este deja , nu are rost să folosiți JAMN sau JAMZ Rețineți că dacă toți biții JAM sunt , atunci adresa următoarei instrucțiuni este pur și simplu numărul de biți din câmpul NEXT ADDRESS Dacă bitul JAMN sau JAMZ este , atunci există două adrese potențiale pentru următoarea microinstrucțiune (simbolurile Ox indică faptul că numărul care le urmează este dat în notație hexazecimală): adresa NEXT ADDRESS și adresa NEXT ADDRESS OR la x (presupunând că NEXT ADDRESS a a a SP-^ a a a a a LV a LV-^ a LV a LV-^ a +a a B C D Orez Utilizarea stivei de operanzi pentru a efectua aritmetica Acum putem efectua calculul executând o comandă care scoate două cuvinte din stivă, le adună și împinge rezultatul înapoi în stivă, așa cum se arată în Figura , c Cuvântul de sus poate fi apoi scos din stivă și plasat în variabila locală al, așa cum se arată în Figura , oraș Capitolul Stratul de microarhitectură Cadrele variabile locale și stivele de operanzi pot fi amestecate De exemplu, când funcția / este apelată la evaluarea expresiei x + /(x), o parte a acestei expresii (x ) poate fi în stiva de operanzi Rezultatul evaluării funcției rămâne pe stiva de deasupra x , astfel încât instrucțiunea următoare poate adăuga operanzii Trebuie menționat că toate mașinile folosesc stiva pentru a stoca variabilele locale, dar nu toate îl folosesc pentru a stoca operanzi Majoritatea mașinilor nu au o stivă de operanzi, dar atât JVM-ul cât și IJVM au Vom acoperi operațiunile stivei în detaliu în Capitolul Model de memorie IJVM Și acum ne putem uita la arhitectura IJVM Este format din memorie, care poate fi vizualizată fie ca o matrice de de octeți ( GB), fie ca o matrice de de cuvinte, fiecare conținând octeți Spre deosebire de majoritatea arhitecturilor de instrucțiuni, Java Virtual Machine nu face accesele de memorie vizibile la nivel de instrucțiuni, ci are câteva adrese implicite care formează baza unui pointer Instrucțiunile IJVM pot accesa memoria numai prin acești pointeri Sunt definite următoarele zone de memorie: ♦ Un set de constante Această regiune, care nu poate fi scrisă dintr-un program IJVM, constă din constante, șiruri și pointeri către alte regiuni de memorie care pot fi referite Această zonă este încărcată când programul este încărcat în memorie și nu se modifică după aceea Există un registru ascuns CPP (Constant Pool Pointer - un pointer către un set de constante), care conține adresa primului cuvânt al setului de constante ♦ Cadrul variabilelor locale Această zonă este concepută pentru a stoca variabile în timpul execuției procedurii După cum sa menționat deja, se numește cadrul variabilelor locale La începutul acestui cadru se află parametrii (sau argumentele) procedurii apelate Cadrul variabil local nu include o stivă de operanzi Se aseaza separat Din motive de performanță, am plasat stiva de operanzi chiar deasupra cadrului variabil local Există un registru ascuns care conține adresa primei variabile cadru Vom numi acest registru LV (variabilă locală) Parametrii procedurii apelate sunt stocați la începutul cadrului variabil local ♦ Stiva de operanzi Stiva de operanzi nu trebuie să fie mai mare decât o anumită dimensiune, care este precalculată de compilatorul Java Spațiul stivei de operanzi este situat direct deasupra cadrului variabil local, așa cum se arată în Figura În acest caz, este convenabil să ne gândim la stiva de operanzi ca parte a cadrului variabil local În ambele cazuri, există un registru virtual care conține adresa cuvântului de sus al stivei Rețineți că, spre deosebire de registrele CPP și LV, acest pointer se modifică în timpul execuției procedurii pe măsură ce operanzii sunt împinși în și în afara stivei Exemplu de arhitectură de set de instrucțiuni - IJVM ♦ Zona de procedură În cele din urmă, există zona de memorie care conține programul Există un registru virtual care conține adresa instrucțiunii care urmează să fie apelată Acest indicator este numit Program Counter (PC) Spre deosebire de alte zone de memorie, zona de procedură este o matrice de octeți SP Set de constante SRR Stiva de operanzi curente Localnici actuali Cadru variabil local Cadru variabil local LV Orez zone de memorie IJVM Zona de procedură RS Ar trebui făcută o remarcă despre indicații Registrele CPP, LV și SP indică cuvinte, nu octeți, iar decalajele apar cu un anumit număr de cuvinte De exemplu, valorile LV, LV + și LV + indică primele trei cuvinte ale unui cadru variabil local, iar LV, LV + și LV + indică cuvintele la patru cuvinte ( octeți) distanță Registrul PC, pe de altă parte, conține adrese de octeți, iar schimbarea acestuia înseamnă creșterea cu un anumit număr de octeți, nu cuvinte Accesul la memoria registrului PC diferă de accesul altor registre, prin urmare, în mașina Mіs- , este prevăzut un port de memorie special pentru PC Amintiți-vă că dimensiunea sa este de doar un octet Dacă măriți PC-ul cu unul și efectuați o citire, acest lucru va determina apelarea următorului octet Dacă creșteți SP cu unul și efectuați o citire, acest lucru va face ca următorul cuvânt să fie apelat Setul de comenzi IJVM Setul de comenzi IJVM este prezentat în tabel Fiecare instrucțiune constă dintr-un cod operațional și uneori un operand (de exemplu, un offset de adresă sau o constantă) Prima coloană conține codul hexazecimal al comenzii A doua coloană oferă mnemonicul în limbaj de asamblare A treia coloană descrie scopul comenzii Capitolul Stratul de microarhitectură Tabelul Un set de comenzi IJVM Dimensiunea operanzilor byte, const și varnum este de octet Dimensiunea operanzilor disp, index și offset - octeți Notă mnemonică Neh x BIPUSH byte Împinge un octet în stivă x DUP Copiază cuvântul de sus al stivei și îl împinge pe stivă xA GOTO offset Salt necondiționat x IADD Scoate două cuvinte din stivă; împinge suma lor pe stivă x E IAND Scoate două cuvinte din stivă; împinge rezultatul unei înmulțiri logice pe stivă (operație AND) x IFEQ offset Scoate un cuvânt din stivă și sare dacă este zero x B IFLT offset Scoate un cuvânt din stivă și sare dacă este mai mic decât zero x F IFJCMPEQ offset Afișează două cuvinte din stivă; salturi dacă sunt egale x IINC varnum const Adaugă o constantă la o variabilă locală x ILOAD varnum Impinge o variabilă locală în stivă OxWb INVOKEVIRTUAL disp Apelează o procedură x IOR Scoate două cuvinte din stivă; împinge rezultatul unei adăugări logice pe stivă (operație SAU) xAC IRETURN Returnează rezultatul procedurii (întreg) x ISTORE varnum Scoate un cuvânt din stivă și îl stochează în cadrul variabil local x ISUB Scoate două cuvinte din stivă; împinge diferența lor pe stivă x LDC W index Preia o constantă din setul de constante și o împinge în stivă x NOP Nicio acțiune x POP Îndepărtează cuvântul de sus al stivei x F SWAP Schimbă primele două cuvinte ale stivei Comanda xC WIDE Prefix; următoarea comandă conține un index de biți Sunt necesare comenzi pentru a împinge cuvinte din diferite surse în stivă Sursele sunt setul constant (LDC W), cadrul variabil local (ILOAD) și comanda în sine (BIPUSH) O variabilă poate fi, de asemenea, scoasă din stivă și stocată în cadrul variabilelor locale (ISTORE) Două operații aritmetice (IADD și ISUB) și două operații logice (IAND și I R) pot fi efectuate pe primele două cuvinte ale stivei Când se efectuează orice operație aritmetică sau logică, două cuvinte sunt scoase din stivă și rezultatul este împins înapoi pe stivă Există instrucțiuni de sărituri: una pentru un salt necondiționat (GOTO) și alte trei pentru sărituri condiționate (IFEQ, IFLT și IF ICMPEQ) Toate acestea co Exemplu de arhitectură de set de instrucțiuni - IJVM Mands schimbă valoarea PC-ului la dimensiunea offset-ului lor, care urmează opcode-ul din comandă Operandul offset este format din biți Este adăugat la adresa opcode-ului Există, de asemenea, comenzi pentru schimbarea celor două cuvinte de sus ale stivei (SWAP), duplicarea cuvântului de sus (DUP) și ștergerea cuvântului de sus (POP) Unele comenzi au un format complex care permite prescurtarea versiunilor utilizate în mod obișnuit Dintre toate mecanismele pe care le folosește JVM pentru a face acest lucru, am inclus două în IJVM Într-un caz, am omis forma scurtă în favoarea celei mai tradiționale Într-un alt caz, arătăm cum poate fi folosită comanda prefix WIDE pentru a schimba următoarea comandă În sfârșit, există comanda de a apela o altă procedură (INVOKEVIRTUAL) și comanda de a ieși din procedura curentă și de a reveni la procedura din care a fost apelată (IRETURN) Datorită complexității mecanismului, am simplificat puțin definiția Limitarea este că, spre deosebire de limbajul Java, în exemplul nostru, o procedură poate apela doar o procedură care se află în interiorul ei Deși această restricție este contrară limbajului Java, ea permite un mecanism mai simplu fără a fi nevoie să aloce dinamic procedura (Dacă nu sunteți familiarizat cu programarea orientată pe obiecte, puteți ignora această sugestie Tocmai am transformat Java dintr-un limbaj orientat pe obiecte într-un limbaj simplu precum C sau Pascal ) Pe toate mașinile, cu excepția JVM-ului, adresa procedura care urmează să fie apelată este direct definită de comanda CALL, deci abordarea noastră este mai degrabă regula decât excepția Mecanismul de apelare a procedurii este următorul Mai întâi, programul apelant împinge un pointer către obiectul apelat pe stivă Pe fig , iar acest indicator este notat prin simbolurile OBJREF Programul care apelează apoi împinge parametrii procedurii (în acest exemplu, Parametrul Y, Parametrul și Parametrul ) în stivă După aceea, comanda INVOKEVIRTUAL este executată Comanda INVOKEVIRTUAL include o adresă relativă (disp) care indică o poziție într-un set de constante Această poziție conține adresa de pornire a procedurii apelate, care este stocată în zona procedurilor Primii octeți din zona de procedură conțin date speciale Primii octeți sunt un număr întreg de biți care indică numărul de parametri pentru această procedură (parametrii înșiși au fost introduși anterior în stivă) În acest caz, pointerul OBJREF este tratat ca un parametru, parametrul Acest număr întreg de biți, împreună cu valoarea SP, oferă adresa OBJREF Rețineți că registrul LV indică OBJREF, nu primul parametru real Alegerea a ceea ce indică LV este oarecum arbitrară Următorii octeți din zona procedurii sunt un alt număr întreg de biți care specifică dimensiunea zonei variabile locale pentru procedura apelată Faptul este că pentru această procedură este furnizat un nou stivă, care este situat direct deasupra cadrului de variabile locale, iar acest număr este necesar pentru aceasta În cele din urmă, al cincilea octet din zona de procedură conține codul pentru prima operație care trebuie efectuată Capitolul Stratul de microarhitectură Stack până când INVOKEVIRTUAL este executat împins afară din stiva opțiuni Procedura de apelare a cadrului variabil local Parametrul f Valoarea anterioară LV Valoare PC anterioară Variabile locale ale procedurii de apelare Parametru Parametru Indicator de legătură SP LV Stack după executarea comenzii INVOKEVIRTUAL Baza stivei după executarea comenzii INVOKEVIRTUAL Baza stivei înainte de executarea instrucțiunii INVOKEVIRTUAL I \h:% hystr? Apelant LV , * proceduri ' , , înregistrați apelantul -rs "procedura i\ Spaţiu •pentru variabilele locale ' /( procedura de apelare ' ; Parametrul Parametrul / Parametrul Valoarea anterioară LV Valoarea anterioară RS Procedura de apelare Variabile locale Frame Parametrul Parametrul Indicator de legătură b Orez Memorie înainte de executarea comenzii INVOKEVIRTUAL (a); memorie după executarea acestei comenzi (b) Să vedem ce se întâmplă înainte ca procedura să fie apelată (vezi și Figura ) Cei doi octeți nesemnați care urmează codului operațional sunt utilizați pentru a indexa tabelul constant (primul octet este ridicat) Comanda calculează adresa de bază a unui nou cadru de variabile locale Pentru a face acest lucru, numărul de parametri este scăzut din indicatorul stivei și LV este setat la OBJREF OBJREF stochează adresa celulei care conține valoarea veche a PC-ului Această adresă se calculează după cum urmează Adresa conținută în registrul LV se adaugă la dimensiunea cadrului variabilelor locale (parametri + variabile locale) Chiar deasupra adresei la care urmează să fie stocată vechea valoare PC se află adresa la care urmează să fie stocată vechea valoare LV Stiva pentru procedura nou apelată începe deasupra acestei adrese SP indică vechea valoare LV, a cărei adresă se află imediat sub prima locație de stivă goală Amintiți-vă că SP indică întotdeauna cuvântul de sus al stivei Dacă stiva este goală, atunci SP indică adresa imediat sub stivă, deoarece stiva este umplută de jos în sus Exemplu de arhitectură de set de instrucțiuni - IJVM În cele din urmă, pentru a executa instrucțiunea INVOKEVIRTUAL, trebuie să faceți ca registrul PC să arate către al cincilea octet din spațiul de cod al procedurii Comanda IRETURN este opusul comenzii INVOKEVIRTUAL (Figura ) Eliberează spațiul folosit de procedură De asemenea, readuce stiva la starea anterioară, cu excepția faptului că, mai întâi, OBJREF și toți parametrii sunt eliminați din stivă; în al doilea rând, valoarea returnată este împinsă în stivă, unde era parametrul OBJREF Pentru a restabili starea anterioară, comanda IRETURN trebuie să returneze valorile anterioare ale pointerilor PC și LV Pentru a face acest lucru, se referă la indicatorul de legătură (acesta este un cuvânt determinat de valoarea curentă a LV) În această locație, unde se afla inițial parametrul OBJREF, comanda INVOKEVIRTUAL a stocat o adresă care conținea vechea valoare PC Acest cuvânt, precum și cuvântul de deasupra lui, sunt extrase pentru a restabili vechile valori PC și, respectiv, LV Valoarea returnată, care este stocată în partea de sus a stivei procedurii de ieșire, este copiată în locația originală a parametrului OBJREF, după care SP începe să indice acea adresă Și apoi controlul trece la comanda care urmează imediat INVOKEVIRTUAL Stivuiți până când se execută IRETURN Cadru de variabile locale "Procedura de apelare" Valoare returnată Valoarea anterioară LV Valoarea anterioară RS Variabile locale ale procedurii de apelare Parametrul Parametrul Parametrul Indicator de legătură Valoarea anterioară LV Valoarea anterioară RS Variabile locale ale procedurii de apelare Parametrul Parametrul - Indicator de legătură SP LV Baza stivei după executarea instrucțiunii IRETURN A Baza stivei înainte de executarea instrucțiunii IRETURN Stack după IRETURN Returnabil Valoarea anterioară LV Valoare PC anterioară Variabile locale ale procedurii de apelare Parametru Parametru - Pointer de legătură SP LV b Orez Memorie înainte de executarea comenzii IRETURN (a); memorie după executarea acestei comenzi (b) Capitolul Stratul de microarhitectură Până acum, mașina noastră nu a avut nicio comandă I/O Nu le vom prezenta În exemplul nostru, ca și în Java Virtual Machine, acestea nu sunt necesare, iar descrierea JVM nu menționează niciodată procesele I/O Se crede că o mașină fără mecanisme I/O este mai fiabilă (Citirea și scrierea se fac în JVM apelând proceduri speciale ) Compilarea IJVM Acum să vedem ce legătură are limbajul Java cu IJVM Lista arată un mic fragment din programul Java Compilatorul Java ar trebui să rescrie acest program în programul de limbaj de asamblare IJVM prezentat în Listarea Numerele de la la din partea stângă a listei, precum și comentariile după barele oblice duble (//), nu fac parte din programul în sine Ele sunt date pentru claritate și pur și simplu fac mai ușor de înțeles Asamblatorul Java îl va traduce apoi într-un program binar Acest program este prezentat în Lista (De fapt, ieșirea compilatorului Java este imediat binară ) În acest exemplu, i este variabila locală , j este variabila locală și k este variabila locală Lista Fragment de program Java i=j+k; dacă(I== ) k= ; el se j=jl: Lista Program pentru IJVM în limbaj de asamblare Java ILOAD j // =j+k ÎNCĂRCARE k IADD ISTORE ILOAD // f( == ) BIPUSH IFJCMPEQLI ILOAD j UJ=j- BIPUSH ISUB Și ISTORE j GOTO L LI: BIPUSH // k= ISTORE k L : Lista Program pentru IJVM în cod hex x x x x x x x x x x x x F x x D x x x x Exemplu de implementare a microarhitecturii x x x xA x x x x x x Programul compilat este simplu Mai întâi, j și k sunt împinși pe stivă, adunați împreună, iar rezultatul este stocat în i Apoi i și constanta sunt împinse pe stivă și comparate Dacă sunt egale, atunci se face o ramură condiționată la L , unde k primește valoarea Dacă nu sunt egale, atunci se execută partea de program după instrucțiunea IF ICMPEQ După aceea, se efectuează tranziția la L , unde părțile ele și apoi sunt combinate Stiva de operanzi pentru programul din Lista este prezentată în Figura - Înainte de a începe programul, stiva este goală, ceea ce este arătat de linia orizontală de deasupra numărului După executarea primei instrucțiuni ILOAD j, acesta este plasat pe stivă (dreptunghiul de deasupra numărului din figură) Numărul înseamnă că prima comandă a fost executată După executarea celei de-a doua instrucțiuni ILOAD, există deja două cuvinte pe stivă, așa cum se arată în caseta de deasupra numărului După executarea instrucțiunii IADD, rămâne doar un cuvânt pe stivă, care este suma j + k Când cuvântul de sus este scos din stivă și stocat în i, stiva devine din nou goală La GNK-| g~~g~ DESPRE □EOZ Orez Starea stivei după executarea fiecărei instrucțiuni din programul prezentat în Listarea Comanda (ILOAD) pornește instrucțiunea if Această comandă împinge i în stivă Apoi vine constanta (în comanda ) După comparație, stiva devine din nou goală ( ) Comanda este începutul fragmentului else Continuă până la instrucțiunea , când se face saltul la eticheta L Exemplu de implementare a microarhitecturii Am descris în detaliu micro- și macro-arhitectura Rămâne de implementat Cu alte cuvinte, trebuie să aflăm ce este un program la nivel de microarhitectură care interpretează microinstrucțiunile și cum funcționează Înainte de a face acest lucru, să ne familiarizăm cu notația pe care o vom folosi pentru descriere Capitolul Stratul de microarhitectură Microinstrucțiuni și înregistrarea acestora În principiu, am putea descrie funcționarea memoriei de control folosind sistemul de numere binar, de biți pe cuvânt Dar este mult mai convenabil să introduceți un sistem de notație cu care puteți transmite esența problemelor luate în considerare și, în același timp, să nu intrați în detalii inutile Este important să înțelegem că limbajul ales este destinat să ilustreze principiile de bază ale modului în care funcționează programul și nu este deloc destinat utilizării în proiecte noi Dacă scopul nostru ar fi aplicarea practică a limbajului, am introduce o notație complet diferită pentru a maximiza flexibilitatea programului În acest caz, problema alegerii adreselor ar fi foarte importantă, deoarece adresele din memorie sunt neordonate Cât de eficient vor fi alese adresele este determinat de capacitatea dezvoltatorului Prin urmare, vom introduce un limbaj simbolic simplu care descrie complet fiecare operație, dar fără a defini complet toate adresele necesare Notația noastră arată toate acțiunile care au loc pe o linie într-un ciclu Teoretic, am putea folosi un limbaj de nivel înalt pentru a descrie aceste operațiuni, dar un astfel de limbaj nu permite dezvoltatorului să aibă control deplin asupra buclelor Datorită acestui control, puteți analiza fiecare ciclu, puteți înțelege toate operațiunile și le puteți verifica Dacă scopul dezvoltării este de a îmbunătăți viteza și performanța, fiecare ciclu contează În implementarea practică, multe tehnici diferite pot fi utilizate pentru a salva ciclurile Există un mare beneficiu pentru această economie: dacă o instrucțiune cu patru cicluri este redusă cu cicluri, va rula de două ori mai repede, iar această creștere a vitezei va fi atinsă de fiecare dată când această instrucțiune este apelată O abordare posibilă este să oferiți pur și simplu o listă de semnale care ar trebui să se declanșeze în fiecare ciclu Să presupunem că într-un ciclu dorim să creștem valoarea SP cu unul De asemenea, dorim să inițiem o operație de citire și astfel încât următoarea comandă să fie în celula a memoriei de control Atunci am putea scrie ReadRegister=SP, ALU=INC WSP Citiți, NEXT ADDRESS= Aici WSP înseamnă "registru de scriere SP" Această intrare este completă, dar greu de înțeles În schimb, vom combina operațiunile specificate și vom transmite rezultatul acțiunilor în înregistrare: SP = SP + ; rd Să numim microasamblatorul nostru de nivel înalt MAL (Micro Assembly Language - microassembler) În franceză, "mal" înseamnă "boală" - asta se va întâmpla cu tine dacă scrii programe prea mari în această limbă Limbajul MAL a fost inventat doar pentru a demonstra principalele caracteristici ale microarhitecturii În timpul fiecărui ciclu, orice registre poate fi scris, dar de obicei este scris doar unul Valoarea unui singur registru poate fi transferată pe magistrala Viv ALU Pe magistrala A, poate fi + , , - și înregistrarea H Prin urmare, pentru a desemna un anumit Exemplu de implementare a microarhitecturii Pentru o operație leneșă, putem folosi un operator de atribuire simplu, ca în limbajul Java De exemplu, pentru a copia registrul SP în registrul MDR, putem scrie MDR=SP Pentru a arăta că folosim o funcție ALU, putem scrie, de exemplu, astfel: MDR = H + SP Această linie înseamnă că valoarea registrului H este adăugată la valoarea registrului SP și rezultatul este scris în registrul MDR Operația de adunare este comutativă (însemnând că ordinea operanzilor nu contează), deci expresia de mai sus poate fi scrisă ca MDR = SP + N Aceasta generează aceeași microinstrucțiune de de biți, deși, strict vorbind, H este operandul din stânga al ALU Trebuie să folosim numai operațiuni valide; sunt enumerate mai jos (oricare dintre operațiunile enumerate poate fi extinsă prin adăugarea caracterelor " ", ceea ce înseamnă mutarea rezultatului la stânga cu octet, de exemplu, este adesea folosită operația H = MBR " "): DEST=H DEST = SURSA DEST=R DEST=SUURCE DEST = H + SURSA DEST = H + SURSA + DEST = H + DEST = SOURCE + DEST = SOURCE - H DEST = SOURCE - DEST = -H DEST = H ȘI SURSA DEST=H SAU SURSA DEST = DEST = DEST = - Aici SOURCE este valoarea oricăruia dintre registre: MDR, PC, MBR, MBRU, SP, LV, CPP, TOS și OPC; un MBRU înseamnă MBR nesemnat, adică valoarea registrului MBR este nesemnat Toate aceste registre pot acționa ca surse de valoare pentru ALU (ele intră în ALU prin magistrala B) În mod similar, DEST se poate referi la oricare dintre următoarele registre: MAR, MDR, PC, SP, LV, CPP, TOS, OPC și H; fiecare dintre aceste registre poate fi ținta unei ieșiri ALU care este trimisă la registrele de pe magistrala C Multe declarații aparent rezonabile sunt invalide De exemplu, următoarea expresie pare destul de corectă, dar această operație nu poate fi efectuată în calea datelor prezentată în Fig , pentru un ciclu: MDR = SP + MDR Capitolul Stratul de microarhitectură Această restricție există deoarece pentru operația de adunare (spre deosebire de creșterea sau descreșterea cu ) unul dintre operanzi trebuie să fie valoarea registrului H În mod similar, de exemplu, această expresie ar putea fi utilă: H = H - MDR Cu toate acestea, este invalid, deoarece singura sursă posibilă a subtraendului este registrul H Nu ar trebui să existe expresii în asamblare care să pară a fi valide, dar de fapt nevalide Notația noastră permite mai mulți operatori de atribuire De exemplu, pentru a adăuga la registrul SP și pentru a stoca valoarea rezultată în registrele SP și MDR, veți scrie următoarele: SP=MDR=SP+ Pentru a desemna procesele de citire din memorie și scriere în cuvinte de memorie de octeți, vom introduce operatorii rd și wr în microinstrucțiune Pentru a apela un octet printr-un port de un octet, utilizați instrucțiunea fetch Operațiile de atribuire și operațiunile de manipulare a memoriei pot avea loc în aceeași buclă Ceea ce se întâmplă într-un ciclu este scris pe o singură linie Pentru a evita confuzia, reamintim încă o dată că Mis- poate accesa memoria în două moduri La citirea și scrierea cuvintelor de date de octeți, sunt utilizate registrele MAR și MDR Aceste procese sunt prezentate în microinstrucțiuni prin instrucțiunile rd și, respectiv, wr La citirea codurilor operaționale pe un singur octet din fluxul de instrucțiuni, sunt utilizate registrele PC și MBR În microinstrucțiune, acest lucru este arătat de instrucțiunea fetch Ambele tipuri de operații de memorie pot avea loc simultan Totuși, același registru nu poate primi o valoare din memorie și calea datelor în același ciclu Luați în considerare un fragment de program: MAR=SP: rd MDR=H Ca urmare a executării primei microinstrucțiuni, valoarea din memorie este atribuită registrului MDR la sfârșitul celei de-a doua microinstrucțiuni Cu toate acestea, a doua microinstrucțiune atribuie o valoare diferită registrului MDR în același timp Aceste două sarcini sunt în conflict deoarece rezultatele sunt nedefinite Rețineți că fiecare microinstrucțiune trebuie să specifice în mod explicit adresa următoarei microinstrucțiuni Cu toate acestea, se întâmplă adesea ca o micro-comandă să fie apelată de o singură micro-comandă și tocmai cea care se află în linia anterioară Pentru a simplifica munca programatorului, microasamblatorul atribuie de obicei o adresă fiecărei microinstrucțiuni (ordinea adreselor poate să nu se potrivească cu succesiunea microinstrucțiunilor din memoria de control) și completează câmpul NEXT ADDRESS astfel încât ordinea în care sunt executate microinstrucțiunile să corespundă cu ordinea liniilor de microprogram Cu toate acestea, programatorul trebuie uneori să sară, fie condiționat, fie necondiționat A scrie salturi necondiționate este simplu: goto labei O astfel de intrare poate fi inclusă în orice microinstrucțiune Specifică în mod explicit numele următoarei microinstrucțiuni De exemplu, foarte des după Exemplu de implementare a microarhitecturii secvența de microinstrucțiuni se termină cu o revenire la prima instrucțiune a buclei principale, astfel încât ultima instrucțiune din fiecare astfel de secvență conține intrarea goto maini Rețineți că operațiunile normale apar în calea datelor chiar și în timpul execuției microinstrucțiunilor care conțin o instrucțiune goto Fiecare microinstrucțiune are un câmp NEXT ADDRESS Declarația goto îi spune asamblatorului să pună o valoare specială în acest câmp în locul adresei microinstrucțiunii scrise pe linia următoare În principiu, fiecare linie ar trebui să conțină o intrare goto, dar dacă adresa dorită este adresa unei microinstrucțiuni scrise pe linia următoare, goto poate fi omis pentru comoditate Pentru salturi condiționate, avem nevoie de o altă notație Amintiți-vă că JAMN și JAMZ folosesc biții N și, respectiv, Z De exemplu, uneori trebuie să verificați dacă valoarea unui registru nu este egală cu zero Pentru a face acest lucru, se poate trece această valoare prin ALU, stocând-o după aceea în același registru Atunci am scrie TOS=TOS Intrarea pare amuzantă, dar face ceea ce trebuie să facă (setează declanșatorul Z și scrie valoarea în registrul TOS) Pentru lizibilitatea firmware-ului, am extins limbajul MAL prin adăugarea a două noi registre imaginare, N și Z, cărora li se pot atribui valori De exemplu: Z=TOS Această linie trece valoarea registrului TOS prin ALU, setând flip-flop-ul Z (și N), dar nu stochează valoarea în niciunul dintre registre Folosind registrul Z sau N ca țintă îi spune microasamblatorului > să seteze toți biții din câmpul C la (vezi Figura ) Calea datelor trece printr-un ciclu normal, sunt efectuate toate operațiunile normale permise, dar niciunul dintre registre nu este scris Nu contează care registru este țintă, N sau Z Microinstrucțiunile pe care le generează microasamblatorul sunt aceleași (Programatorii care aleg registrul greșit vor fi penalizați pentru o săptămână de lucru pe primul PC IBM la , MHz ) Pentru ca microasamblatorul să seteze bitul JAMZ, scrieți următoarele: f(Z) goto LI; altfel mergi la L Deoarece hardware-ul necesită cei biți cei mai puțin semnificativi din aceste adrese pentru a se potrivi, microasamblatorul trebuie să le atribuie astfel de adrese Pe de altă parte, eticheta L poate fi în oricare dintre cele de cuvinte inferioare ale memoriei de control, astfel încât microasamblatorul poate găsi cu ușurință perechea potrivită Adesea, aceste două afirmații sunt combinate De exemplu: Z=TOS; if(Z) merge la LI; altfel mergi la L Ca urmare a acestei scrieri, MAL va genera o microinstrucțiune în care valoarea registrului TOS este trecută prin ALU, dar nu este stocată nicăieri, deci această valoare setează bitul Z Imediat după încărcarea din ALU, bitul Z este conectat la registrul MSB printr-un circuit SAU, din cauza a ce Capitolul Stratul de microarhitectură adresa următoarei microinstrucțiuni va fi apelată fie pe L , fie pe L Valoarea registrului MPC este stabilizată și o poate folosi pentru a apela următoarea microinstrucțiune În cele din urmă, avem nevoie de o intrare specială pentru a activa bitul JMPC: du-te (MBR SAU vaiii) Această intrare îi spune microasamblatorului să folosească valoarea vaiie pentru câmpul NEXT ADDRESS și să seteze bitul JMPC astfel încât registrul MBR să fie OR în registrul MPC împreună cu valoarea NEXT ADDRESS Dacă valoarea vаіе este , este suficient să scrieți du-te la (MBR) Rețineți că doar cei biți mai puțin semnificativi ai registrului MBR sunt conectați la registrul MPC (vezi Figura ), astfel încât problema extinderii semnului nu se pune aici De asemenea, rețineți că este utilizată valoarea MBR disponibilă la sfârșitul ciclului curent La momentul apelului în micro-instrucțiunea curentă, este deja prea târziu pentru a selecta următoarea micro-instrucțiune Implementarea IJVM folosind microarhitectura Mis- Acum am ajuns deja la punctul în care puteți conecta toate piesele împreună În tabel arată firmware-ul care rulează pe microarhitectura Mіs- și interpretează IJVM Programul este foarte scurt - doar microinstrucțiuni Tabelul are trei coloane Prima coloană conține denumirea simbolică a micro-comandei, a doua - micro-comandă în sine, iar a treia - comentariul După cum am observat deja, secvența de microinstrucțiuni nu corespunde neapărat cu succesiunea de adrese din memoria de control Tabelul Microprogram pentru microarhitectura Mis- Comentariu de operații de microcomandă Maipi PC = PC+ ; aduce; goto(MBR) MBR-ul conține opcode; obține următorul octet; referinţă por goto mâini nu se întâmplă nimic iaddlMAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei iadd H = TOS H = partea de sus a stivei iadd MDR=TOS=MDR+H; wr; goto Mâini Însumarea primelor două cuvinte; scriind suma în poziția de sus a stivei isubl MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei isub H = TOS H = partea de sus a stivei isub MDR=TOS=MDR-H; wr; goto Mâini Scădere; împingând rezultatul în vârful stivei Exemplu de implementare a microarhitecturii Comentariu de operații de microcomandă iapsp MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei iand H = TOS H = partea de sus a stivei iand MDR=TOS=MDR&H; wr; mergeți la Mâini Operațiunea ȘI; împingând rezultatul în vârful stivei ior MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei ior H = TOS H = partea de sus a stivei ior MDR = TOS = MDR SAU H; wr; dus la operațiunea Mâini OR; împingând rezultatul în vârful stivei dup MAR = SP = SP + Incrementați SP cu și copiați rezultatul în registrul MAR dup MDR=TOS; wr; goto Mâini Împingerea unui cuvânt nou pe stivă popi MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei pop Programul așteaptă în timp ce noua valoare a registrului TOS este citită din memorie pop TOS = MDR; goto Mâini Copiați cuvântul nou în registrul TOS swapl MAR = SP = SP - ; rd Setați registrul MAR la SP - ; citește al doilea cuvânt din stivă swap MAR = SP Setați registrul MAR la cuvântul de sus al stivei swap H = MDR; wr Stochează valoarea TOS în registrul H; împingând al doilea cuvânt în vârful stivei swap MDR = TOS Copiați valoarea TOS anterioară în registrul MDR swap MAR = SP - ; wr Setați registrul MAR la SP- ; împingând al doilea cuvânt pe stivă swap TOS=H; mergeți la actualizarea Mâini TOS bipushl SP = MAR = SP + MBR = octet care trebuie împins pe stivă bipush PC = PC + ; aducă Mărește PC-ul cu ; apelați următorul cod de operare bipush MDR=TOS=MBR; wr; goto Mâini Adăugați un bit de semn suplimentar la un octet și împingeți valoarea în stivă iload H = LV MBR conține indice; copiați valoarea LV în N iload MAR=MBRU+H; rd MAR = adresa variabilei locale care urmează să fie împinsă în stivă iload MAR = SP = SP + Registrul SP indică noul vârf al stivei; pregătirea pentru înregistrare iload PC=PC+ ; aduce; wr Creșteți valoarea PC cu ; apel cod următoarea operație; scriind partea de sus a stivei Continuare & Capitolul Stratul de microarhitectură Tabelul (continuare) Comentariu de operații de microcomandă iloadS TOS = MDR; mergeți la actualizarea Mâini TOS istorel H = LV MBR conține indice; copiați valoarea LV în N istore MAR = MBRU + H MAR = adresa variabilei locale pentru a stoca cuvântul din stivă istore MDR=TOS; wr Copiați valoarea TOS în registrul MDR; introducerea de cuvinte istore SP=MAR=SP- ; rd Citiți din stivă al doilea cuvânt de sus store PC=PC+ ; aducă Mărește PC-ul cu ; apelați următorul cod operațional store TOS=MDR; mergeți la actualizarea Mâini TOS widel PC = PC + ; preluați Fetch operand byte sau următorul cod de operație wide goto(MBR SAU x ) Salt la nivel încrucișat la adrese mai înalte widejloadl PC = PC + ;fetch MBR conține primul octet al indexului; apel al doilea octet wide iload H = MBRU " H = primul octet index deplasat la stânga cu biți wide iload H=MBRU SAU H H = index variabil local pe biți wide iload MAR = LV + H; rd; goto iload MAR = adresa variabilei locale de împins în stivă widejstorel PC = PC + ;fetch MBR conține primul octet al indexului; apel al doilea octet wide istore H = MBRU " H = primul octet index deplasat la stânga cu biți wide istore H = MBRU SAU H H = index variabil local pe biți wide istore MAR=LV+H; rd; goto istore MAR = adresa variabilei locale pentru a împinge cuvântul din stivă în Idc w PC = PC + ; fetch MBR conține primul octet al indexului; apel al doilea octet Idc w H = MBRU " H = primul octet index deplasat la stânga cu biți Idc w H = MBRU SAU H H = indice de biți al constantei în setul constant Idc w MAR = H + CPP; rd; goto iload MAR = adresa constantei în setul constant iind H = LV MBR conține indice; copiați valoarea LV în N iinc MAR=MBRU+H; rd Copiați suma valorii LV și a indicelui în registrul MAR; citirea unei variabile ips PC = PC + ; Preluați apelul constant Exemplu de implementare a microarhitecturii Comentariu de operații de microcomandă ips H = MDR Copiați variabila în înregistrarea H iips PC = PC + ; preluați Apelați următorul cod operațional ipsb MDR = MBR + H; wr; goto Mâini Scrie suma în registrul MDR; actualizare variabilă gotol OPC = PC - Adresa opcode de stocare goto PC=PC+ ; fetch MBR = primul octet de offset; apel al doilea octet goto H = MBR " Schimbați primul octet rămas cu biți și stocați-l în registrul H goto H = MBRU SAU H H = offset de salt pe biți goto PC=OPC+H; fetch Suma offset și OPC goto goto Mâini Așteptați următorul apel opcode ifltl MAR=SP=SP- ; rd Citiți al doilea cuvânt din partea de sus a stivei iflt OPC = TOS Stocați temporar TOS în OPC iflt TOS = MDR Scrieți noua stivă în TOS iflt N=OPC; dacă(N) a ajuns la T; altfel mergi la F Sari pe bit N ifeq MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei ifeq OPC = TOS Stocați temporar TOS în OPC ifeq TOS = MDR Scrieți noua stivă de sus în TOS ifeq Z=OPC; dacă(Z) a ajuns la T; altfel mergi la F Sari pe bit Z ifjcmpeql MAR=SP=SP- ; rd Citiți al doilea cuvânt din partea de sus a stivei if icmpeq MAR = SP = SP - Setați registrul MAR pentru a citi noul vârf al stivei if icmpeq H = MDR; rd Copiați al doilea cuvânt din stivă în înregistrarea H if icmpeq OPC = TOS Stocați TOS temporar în OPC if icmpeq TOS = MDR Împingeți noua stivă de sus în TOS if icmpeq Z = OPC - H; dacă(Z) a ajuns la T; else goto F Dacă primele două cuvinte sunt egale, sari la T; dacă nu sunt egale, mergeți la F T OPC = PC - ; aduce; goto goto La fel ca gotol; necesare pentru adresa obiectului țintă F PC = PC + Omite primul octet de compensare F PC = PC + ; preluați punctele rs la următorul cod operațional F merge la Mâini Așteptați apelul opcode invoke virtual PC = PC + ; fetch MBR = primul octet al indexului; creșterea PC-ului cu ; apel al doilea octet invoke virtual H = MBRU " Schimbați primul octet cu biți și stocați valoarea în registrul H Continuare & Capitolul Stratul de microarhitectură Tabelul (continuare) Comentariu de operații de microcomandă invoke virtual H = MBRU SAU HH = decalaj indicator al procedurii de la registrul CPP invoke virtual MAR = CPP+H; rd Apelați un pointer de procedură dintr-un set de constante invoke virtual OPC = PC + Stocați temporar valoarea PC în registrul OPC invoke virtual PC = MDR; fetch Registrul PC indică o nouă procedură; apelarea numărului de parametri invoke virtual PC = PC + ; fetch Apelează al doilea octet al numărului de parametri invoke virtual H = MBRU " Schimbați primul octet cu biți și stocați valoarea în registrul H invoke virtual H = MBRU SAU H H = numărul de parametri invoke virtual PC = PC + ; fetch Apelați primul octet din dimensiunea zonei variabile locale invoke virtual TOS=SP - H TOS=adresa OBJREF- invoke virtual TOS=MAR=TOS+ TOS=adresa OBJREF (noua valoare LV) invoke virtual PC = PC + ; fetch Apelați al doilea octet din dimensiunea zonei variabile locale invoke virtual H = MBRU " Schimbați primul octet cu biți și stocați valoarea în registrul H invoke virtual H = MBRU SAU H H = dimensiunea zonei variabile locale invoke virtual MDR = SP + H + ; wr Suprascrieți OBJREF cu indicatorul de legătură invoke virtual MAR = SP = MDR Setați registrele SP și MAR la adresa celulei care conține vechea valoare PC invoke virtual MDR=OPC; wr Salvați valoarea veche a PC-ului peste variabilele locale invoke virtual MAR=SP=SP+ SP indică celula în care este stocată vechea valoare LV invoke virtual MDR = LV; wr Salvați vechea valoare LV peste valoarea salvată pe PC invoke virtual PC = PC + ; fetch Apelați primul cod operațional al noii proceduri invoke virtual LV=TOS; goto Mâini Setați valoarea LV la prima adresă a cadrului variabil local ireturnl MAR=SP=LV; rd Resetează registrele SP și MAR pentru a apela indicatorul de legătură ireturn Procesul de citire ireturnSLV=MAR=MDR; rd Setați registrul LV la pointerul de legătură; numind vechea valoare a RS ireturn MAR = LV + Setați registrul MAR să citească vechea valoare a LV Exemplu de implementare a microarhitecturii Comentariu de operații de microcomandă ireturn PC = MDR; rd; preluați PC-ul de recuperare; apelați următorul cod operațional ireturn MAR = SP Setați MAR pentru a scrie TOS ma intorc? LV = MDR LV Recovery ireturn MDR=TOS; wr; goto Mâini Stocați rezultatul în partea de sus a stivei Alegerea numelor pentru majoritatea registrelor prezentate în fig ar trebui să fie evident Registrele CPP (Constant Pool Pointer - pointer către un set de constante), LV (Local paralel - variabilă locală) și SP (Stack Pointer - stack pointer) conțin pointeri către adresele setului de constante, cadrul variabilelor locale și elementul de sus de pe stivă, respectiv, și registrul PC (Program Counter - program counter) conține adresa octetului care urmează să fie apelat din fluxul de comandă în continuare MBR (Memory Buffer Register) este un registru de un octet care conține octeții fluxului de instrucțiuni care provin din memorie pentru interpretare TOS și OPC sunt registre suplimentare Ele sunt descrise mai jos În anumite momente, fiecare dintre aceste registre trebuie să conțină o anumită valoare Cu toate acestea, fiecare dintre ele, dacă este necesar, poate fi folosit și ca unul temporar La începutul și la sfârșitul fiecărei instrucțiuni, registrul TOS (Top Of Stack) conține valoarea adresei de memorie indicată de SP Această valoare este redundantă deoarece poate fi întotdeauna citită din memorie, dar dacă valoarea este stocată într-un registru, nu este necesar accesul la memorie Pentru unele instrucțiuni, utilizarea registrului TOS presupune, dimpotrivă, mai multe accesări la memorie De exemplu, instrucțiunea POP renunță la cuvântul de sus al stivei și, prin urmare, trebuie să preia noua valoare a vârfului stivei din memorie și să o scrie în registrul TOS ORS - registru temporar Nu are un scop anume Poate, de exemplu, să stocheze adresa unui cod operațional pentru o instrucțiune de ramură în timp ce valoarea PC este incrementată pentru a accesa parametrii De asemenea, este folosit ca un registru temporar în instrucțiunile de sărituri condiționate La fel ca toți interpreții, firmware-ul prezentat în tabel include o buclă principală care apelează, decodifică și execută comenzile programului interpretat (în acest caz, comenzi IJVM) Bucla principală începe cu linia Mâini și anume cu invariantul (afirmația) că adresa celulei de memorie care conține codul operației a fost deja încărcată în registrul PC Mai mult, acest cod operațional a fost deja apelat din memorie în registrul MBR Când ne întoarcem la această celulă, trebuie să fim siguri că valoarea PC a fost deja actualizată pentru a indica următorul cod operațional, iar codul operațional în sine a fost deja apelat din memorie în MBR Această secvență de acțiuni are loc la începutul fiecărei comenzi, așa că este important să o mențineți cât mai scurtă posibil Prin dezvoltarea hardware-ului și software-ului microarhitecturii Mis- , am reușit să reducem ciclul principal la o singură microinstrucțiune De fiecare dată când această microinstrucțiune este executată, codul pentru operația de efectuat este deja în MBR Acest microco Capitolul Stratul de microarhitectură Manda, în primul rând, face o tranziție la microcodul care efectuează această operație și, în al doilea rând, apelează următorul octet după codul de operație, care poate fi fie un operand, fie un cod de operație Acum putem explica motivul principal pentru care fiecare micro-instrucțiune specifică în mod explicit următoarea micro-instrucțiune, iar succesiunea comenzilor poate să nu corespundă cu ordinea locației lor în memorie Toate adresele de memorie de control corespunzătoare codurilor operaționale trebuie rezervate pentru primul cuvânt al interpretului de instrucțiuni corespunzător Deci, din Tabel În Figura - , vedem că programul care interpretează instrucțiunea POP începe de la locația x , iar programul care interpretează instrucțiunea DUP începe la locația x (Cum știe MAL să plaseze comanda POP în locația x este unul dintre misterele universului Probabil că există un fișier undeva care îi spune să facă acest lucru ) Din nefericire, programul care interpretează instrucțiunea POP include trei microinstrucțiuni, așa că dacă acestea sunt plasate în memorie secvențial, acest program va fi amestecat cu începutul instrucțiunii DUP Deoarece toate adresele de memorie de control care corespund codurilor operaționale sunt rezervate, toate microinstrucțiunile care urmează primei microinstrucțiuni din fiecare secvență trebuie plasate între adresele rezervate Din acest motiv, există atât de multe "sărituri" încât ar fi nerezonabil să inserați o microinstrucțiune de salt de fiecare dată pentru a sări de la o secvență de adrese la alta Pentru a înțelege cum funcționează interpretul, să presupunem că registrul MBR conține valoarea x , adică opcode-ul IADD (vezi Tabelul ) În bucla principală, care constă dintr-o microinstrucțiune, se execută următoarele: Se mărește valoarea registrului PC, după care conține adresa primului octet după opcode Începe transferul următorului octet în registrul MBR Acest octet va fi necesar mai devreme sau mai târziu, fie ca operand al instrucțiunii IJVM curente, fie ca cod pentru următoarea operație (cum este cazul unei instrucțiuni IADD care nu are operanzi) Se face un salt la adresa cuprinsă în MBR la începutul ciclului Mâini Numărul adresei este egal cu valoarea codului operației care este în curs de executare Această adresă este plasată acolo de către microinstrucțiunea anterioară Rețineți că valoarea care este apelată din memorie în timpul acestei microinstrucțiuni nu joacă niciun rol în tranziția stratului Aici este apelat următorul octet, deci va fi disponibil până la sfârșitul celei de-a treia microinstrucțiuni Deși octetul specificat poate să nu fie necesar în acel moment, oricum va fi necesar într-o zi, așa că nu este rău în faptul că apelul are loc aici Dacă toți biții octetului din MBR sunt (acesta este codul operațional pentru instrucțiunea NOP), atunci următoarea microinstrucțiune este pori, care este apelată din locația Deoarece această instrucțiune nu efectuează nicio operație, pur și simplu sare la începutul buclei principale, unde aceeași secvență de acțiuni, dar cu un nou cod de operare în MBR Exemplu de implementare a microarhitecturii Subliniem încă o dată că micro-instrucțiunile date în tabel nu sunt localizate secvenţial în memorie, iar microinstrucţiunea Mâini nu se află deloc în celula cu adresa (deoarece această celulă ar trebui să conţină microinstrucţiunea pori) Sarcina microasamblatorului este de a plasa fiecare instrucțiune în celula corespunzătoare și de a le lega în secvențe scurte folosind câmpul NEXT ADDRESS Fiecare secvență începe la o adresă care se potrivește cu valoarea numerică a codului operațional (de exemplu, instrucțiunea POP începe la adresa x ), dar restul secvenței poate fi în orice locație din memoria de control, iar aceste locații nu sunt neapărat contigue Acum luați în considerare comanda IADD Începe cu microinstrucțiunea iaddl Trebuie să faceți următoarele: Valoarea registrului TOS este deja acolo, dar al doilea cuvânt al stivei trebuie apelat din memorie Valoarea registrului TOS trebuie adăugată celui de-al doilea cuvânt al stivei, apelat din memorie Rezultatul care este împins pe stivă trebuie să fie stocat în memorie și în registrul TOS Pentru a apela un operand din memorie, este necesar să reduceți indicatorul de stivă și să îl scrieți în registrul MAR Rețineți că această adresă va fi folosită pentru scrierile ulterioare Mai mult, deoarece această locație de memorie va deveni noul vârf al stivei, această valoare trebuie să fie atribuită registrului SP Prin urmare, este posibil să se determine noua valoare a SP și MAR, să scadă valoarea lui SP cu și să o scrie în ambele registre într-o singură operație Toate aceste acțiuni sunt efectuate în prima buclă (iadl) Aici este inițiată operația de citire În plus, registrul MPC își obține valoarea din câmpul NEXT ADDRESS al microinstrucțiunii iaddl Aceasta este adresa microinstrucțiunii iadd Apoi iadd este citit din memoria de control În a doua buclă, în timp ce operandul este citit din memorie, copiem cuvântul de sus al stivei din TOS în H, unde va fi disponibil pentru adăugare când procesul de citire este finalizat La începutul celui de-al treilea ciclu (iadd ) MDR conține al doilea termen, numit din memorie În această buclă, se adaugă la valoarea registrului H, iar rezultatul este stocat înapoi în registrele MDR și TOS În plus, începe o operație de scriere, în timpul căreia noul cuvânt de sus al stivei este stocat în memorie În această buclă, comanda goto atribuie adresa lui Mâini registrului MPC și astfel revenim la punctul de plecare și putem începe următoarea operație Dacă următorul cod operațional IJVM în prezent în MBR este x (ISUB), atunci se repetă aproape aceeași secvență de acțiuni După executarea Mâini, controlul este transferat către microinstrucțiunea cu adresa x (isubl) Această micro-instrucțiune este urmată de i sub , isub și apoi din nou Mâini Singura diferență între aceasta și secvența anterioară este că, în bucla i sub , conținutul registrului H nu este adăugat la valoarea MDR, ci scade din acesta Instrucțiunea IAND este identică cu instrucțiunile IADD și ISUB, doar în acest caz primele două cuvinte ale stivei sunt supuse înmulțirii logice (operație AND), și nu Capitolul Stratul de microarhitectură adunat si nu scazut Ceva similar se întâmplă în timpul execuției comenzii I R Dacă codul operațional se potrivește cu o comandă DUP, POP sau SWAP, atunci trebuie utilizată o stivă Instrucțiunea DUP dublează cuvântul de sus al stivei Deoarece valoarea acestui cuvânt este deja în registrul TOS, trebuie doar să măriți SP cu După aceea, registrul SP va indica noua adresă Această nouă celulă este locul unde este scrisă valoarea registrului TOS Instrucțiunea POP este, de asemenea, destul de simplă: trebuie doar să micșorați valoarea SP cu pentru a elimina cuvântul de sus al stivei Cu toate acestea, după aceea, trebuie să citiți noul cuvânt de sus al stivei din memorie și să îl scrieți în registrul TOS În cele din urmă, instrucțiunea SWAP schimbă valorile a două locații de memorie, și anume primele două cuvinte ale stivei Registrul TOS conține deja una dintre aceste valori, deci nu este nevoie să o citiți (valoarea) din memorie Vom discuta despre această comandă mai detaliat puțin mai târziu Comanda BIPUSH este mai complicată decât cele anterioare deoarece codul operațional este urmat de un octet, așa cum se arată în Figura Acest octet este un număr întreg cu semn Octetul specificat, care a fost transferat către MBR în timpul execuției microinstrucțiunii Mâini, trebuie extins la de biți (extindere semn) și copiat în MDR Valoarea SP este apoi incrementată cu și copiată în MAR, permițând ca operandul să fie împins în partea de sus a stivei Acest operand trebuie de asemenea copiat în registrul TOS Rețineți că valoarea registrului RS trebuie mărită cu , astfel încât microinstrucțiunea Mat pi să conțină codul pentru următoarea operație BIPUSH ( x ) octet Orez Format de comandă BIPUSH Acum luați în considerare comanda ILOAD În această instrucțiune, codul operațional este, de asemenea, urmat de un octet (Fig a), dar acest octet este un index fără semn folosit pentru a găsi cuvântul în spațiul variabil local pentru a fi introdus în stivă Deoarece aici există doar octet, sunt disponibile doar = de cuvinte, și anume primele de cuvinte ale spațiului variabil local Instrucțiunea ILOAD necesită atât o citire (pentru a apela un cuvânt) cât și o scriere (pentru a-l împinge în stivă) Pentru a determina adresa de citire, trebuie să adăugați offset-ul, care este stocat în registrul MBR (acesta este registrul tampon de memorie), la conținutul registrului LV Registrele MBR și LV pot fi accesate numai prin magistrala B, astfel încât mai întâi valoarea LV este copiată în registrul H (în bucla iloadl), apoi se adaugă valoarea MBR Rezultatul însumării este copiat în registrul MAR și începe procesul de citire (în ciclul i oad ) ILOAD ( x ) Index A WIDE ( xC ) ILOAD ( x ) Primul octet de index Al doilea octet de index b Orez Comanda ILOAD cu index de un octet (a); Comanda WIDE ILOAD cu index pe doi octeți (b) Exemplu de implementare a microarhitecturii Totuși, aici MBR-ul este utilizat diferit decât în comanda BIPUSH, unde octetul este extins cu semn În cazul unui index, offset-ul este întotdeauna pozitiv, deci octetul offset trebuie să fie un întreg fără semn (spre deosebire de BIPUSH, unde octetul este un întreg cu semn de biți) Interfața dintre MBR și magistrala B este concepută pentru a permite ambele operațiuni În cazul instrucțiunii BIPUSH (unde octetul este un număr întreg cu semn de biți), bitul din stânga al valorii MBR este copiat în cei de biți cei mai semnificativi ai magistralei B În cazul instrucțiunii ILOAD (unde octetul este un întreg fără semn pe biți), cei mai importanți de biți anvelopele B sunt umpluți cu zerouri Două semnale speciale ajută la determinarea care dintre aceste două operații să fie efectuată (vezi Figura ) În firmware, cuvântul MBR indică un octet semnat (ca în comanda bipush ), iar MBRU indică un octet nesemnat (ca în comanda i oad ) În timp ce se așteaptă ca un operand să sosească din memorie (la momentul i oad ), valoarea registrului SP este incrementată cu pentru a scrie noul vârf al stivei Această valoare este copiată și în registrul MAR (necesar pentru a împinge operandul în stivă) Valoarea PC este apoi mărită din nou cu pentru a apela următorul cod operațional (microinstrucțiune oad ) În cele din urmă, valoarea MDR este copiată în registrul TOS pentru a indica noul cuvânt de sus al stivei (microinstrucțiune iioad ) Comanda ISTORE este opusul comenzii ILOAD (cuvântul de sus este scos din stivă și stocat într-o locație de memorie a cărei adresă este egală cu suma valorii registrului LV și indexul acestei comenzi) În acest caz, se folosește același format ca și în comanda ILOAD (vezi Fig , a), doar că aici opcode-ul nu este x , ci x Deoarece cuvântul de sus al stivei este deja cunoscut (este în registrul TOS), acesta poate fi stocat imediat în memorie Cu toate acestea, noul cuvânt de sus al stivei mai trebuie apelat din memorie, așa că sunt necesare atât o citire, cât și o scriere, deși aceste operațiuni pot fi efectuate în orice ordine (sau chiar simultan, dacă este posibil) Comenzile ILOAD și ISTORE au acces doar la primele de variabile locale Deși acest spațiu este suficient pentru majoritatea programelor, trebuie totuși să puteți accesa orice variabilă locală, indiferent unde se află în cadru Pentru a activa acest lucru, IJVM utilizează aceeași facilitate ca și JVM, un cod operațional WIDE special (numit octet de prefix) urmat de un cod operațional ILOAD sau ISTORE Când se întâlnește o astfel de secvență, formatul comenzii ILOAD sau ISTORE se modifică; conform noului format, codul operațional este urmat de un index de biți în loc de unul de biți, așa cum se arată în Fig b Comanda WIDE este decodificată în mod obișnuit În primul rând, există o tranziție la microinstrucțiunea widel, care se ocupă de codul operațional al instrucțiunii WIDE Deși codul operațional care urmează să fie extins este deja prezent în MBR, microinstrucțiunea largă apelează primul octet după codul operațional deoarece logica firmware-ului o cere Apoi se face o altă tranziție între niveluri, dar de data aceasta octetul care urmează WIDE este folosit pentru tranziție Cu toate acestea, deoarece instrucțiunea WIDE ILOAD necesită un set diferit de microinstrucțiuni decât ILOAD, instrucțiunea WIDE ISTORE necesită o microinstrucțiune diferită de ISTORE și așa mai departe, codul operațional nu poate fi utilizat ca adresă țintă într-un salt de strat Capitolul Stratul de microarhitectură În schimb, microinstrucțiunea largă adaugă în mod logic adresa x și codul operațional în registrul MPC Ca urmare, interpretarea WIDE LOAD începe la adresa x (nu x ), interpretarea WIDE ISTORE începe la adresa x (nu x ) și așa mai departe Astfel, fiecare opcode WIDE începe la o adresă care se află în memoria de control la (adică x ) cuvinte mai mari decât opcode-ul normal corespunzător Secvența inițială de microinstrucțiuni pentru ILOAD și WIDE ILOAD este prezentată în fig Orez Începutul secvenței de microinstrucțiuni pentru comenzile ILOAD și WIDE ILOAD Adresele sunt date ca exemplu Comanda WIDE ILOAD diferă de comanda obișnuită ILOAD doar prin faptul că indexul său este format din doi octeți de index Fuziunea și însumarea ulterioară a acestor octeți trebuie să aibă loc în etape, în timp ce primul octet de index este deplasat la stânga cu biți și copiat în H Deoarece indexul este un întreg fără semn, aici este folosit registrul MBRU (cele cele mai multe biții semnificativi sunt umpluți cu zerouri) Apoi se adaugă al doilea octet de index (operația de adăugare este identică cu operația de îmbinare, deoarece octetul mic al registrului H este în prezent ), asigurându-se în același timp că nu există transport între octeți Rezultatul este din nou stocat în registrul H Din acest moment, au loc aceleași acțiuni ca și în comanda standard ILOAD În loc să duplicăm ultimele micro-instrucțiuni (PoacI la iload ) ale comenzii ILOAD, am sărit pur și simplu de la wideiload la i oad Rețineți că în timpul execuției acestei instrucțiuni, valoarea PC-ului trebuie să fie incrementată cu de două ori, astfel încât la sfârșit acest registru să indice următorul cod operațional Comanda ILOAD incrementează valoarea o dată; secvența de comandă WIDE ILOAD incrementează și această valoare o dată Exemplu de implementare a microarhitecturii Aceeași situație apare atunci când se execută WIDEISTORE După primele patru microinstrucțiuni (de la wide istorel la wideistore ) secvența acțiunilor este aceeași ca în instrucțiunea ISTORE după primele două microinstrucțiuni, așa că sărim de la wide istore la store În continuare, ne vom uita la comanda LDCW Există două diferențe între această comandă și ILOAD În primul rând, conține un offset de biți nesemnat (ca versiunea extinsă a ILOAD), iar în al doilea rând, această instrucțiune este indexată din registrul CPP și nu din LV, deoarece citește valoarea din setul constant și nu din cadru variabil local (Există și o formă scurtă a acestei comenzi, LDC, dar nu am inclus-o în mașina IJVM, deoarece forma lungă conține toate variantele formei scurte, deși durează octeți în loc de ) Comanda IINC este singura comandă, în afară de ISTORE, care poate modifica o variabilă locală Include doi operanzi de câte un octet fiecare, așa cum se arată în Fig IINC ( x ) Constanta indexului Orez Instrucțiunea IINC conține două câmpuri de operanzi Câmpul index este necesar pentru a determina offset-ul de la începutul cadrului variabil local Instrucțiunea citește această variabilă, o incrementează cu o constantă (constanta este conținută în al doilea câmp) și plasează rezultatul înapoi în aceeași locație de memorie Rețineți că constanta este un număr de biți cu semn între - și + JVM acceptă o versiune extinsă a acestei instrucțiuni, în care fiecare operand are octeți Luați în considerare prima comandă de salt, GOTO Această instrucțiune modifică valoarea registrului PC, astfel încât următoarea instrucțiune IJVM să fie în locația de memorie la adresa calculată prin adăugarea unui offset de biți (semnat) la adresa opcode-ului GOTO Dificultatea aici este că offset-ul este legat de valoarea din registrul PC la începutul decodării instrucțiunii, și nu de cea conținută în același registru după apelul offset de octeți Pentru a înțelege mai bine acest lucru, priviți Fig , a Aceasta arată situația care are loc la începutul ciclului Mâini Opcode-ul este deja în MBR, dar valoarea PC nu a crescut încă Pe fig b vedem situația la începutul buclei gotol În acest caz, valoarea PC a fost deja crescută cu , iar primul octet de compensare a fost deja transferat la MBR În următoarea microinstrucțiune (Fig , c), valoarea anterioară a RS, care indică codul operației, este stocată în registrul OPC Această valoare trebuie salvată, deoarece de ea, și nu de valoarea curentă a PC-ului, depinde offset-ul comenzii GOTO Și pentru asta este registrul OCR Micro-instrucțiunea goto începe să apeleze al doilea octet de compensare, ceea ce duce la situația prezentată în Fig d (microinstrucțiune goto ) După ce primul octet offset este deplasat la stânga cu biți și copiat în registrul H, trecem la microinstrucțiunea goto (Fig , E) Acum avem primul octet offset, deplasat la stânga, este în registrul H, al doilea octet offset este în registru Capitolul Stratul de microarhitectură șir MBR, iar baza offset este în registrul OPC În microinstrucțiunea goto , adăugând offset-ul complet de biți la baza offset-ului, obținem o nouă adresă, care este plasată în registrul PC-ului Rețineți că în goto folosim MBRU în loc de MBR pentru că nu avem nevoie de extinderea semnului celui de-al doilea octet Un offset de biți este construit prin adăugarea logică (operație SAU) a celor două jumătăți În cele din urmă, deoarece programul necesită ca codul pentru următoarea operație să fie plasat în MBR înainte de a sări la Mâini, trebuie să apelăm acest cod Ultima buclă, goto , este necesară pentru a plasa în timp datele din memorie în registrul MBR p+ p+ p+ p Offset octet Offset octet Offset octet Offset octet Offset octet Offset byte Offset byte Offset byte Offset byte Offset byte GOTO ( xA ) GOTO ( xA ) GOTO ( xA ) GOTO ( xA ) GOTO ( xA ) Registre ) z = y/x; Aici x, y și z sunt variabile în virgulă mobilă Să presupunem că toate aceste variabile intră în registre în avans, iar instrucțiunea de divizare în virgulă mobilă (această instrucțiune este lentă) se deplasează în sus pe grafic și se execută chiar înainte de instrucțiunea condițională if Din păcate, dacă valoarea lui x este , atunci programul se termină ca urmare a unei încercări de împărțire la Astfel, instrucțiunea speculativă face ca programul corect inițial să eșueze Mai rău încă, programatorul modifică programul pentru a preveni o astfel de situație, dar accidentul apare în continuare O soluție posibilă este versiunile speciale ale acelor comenzi care pot arunca excepții În plus, la fiecare registru se adaugă un așa-numit bit otravă Dacă instrucțiunea speculativă eșuează, nu declanșează o capcană de excepție, ci setează bitul otravă în registrul de rezultate Dacă acest registru este apoi folosit de o instrucțiune normală, excepția este capturată (cum ar trebui să fie în cazul unei excepții) Cu toate acestea, dacă acest rezultat nu este utilizat, bitul otravă este resetat și nu afectează în niciun fel fluxul programului Exemple la nivel de microarhitectură În această secțiune, în lumina materialului abordat în acest capitol, ne vom uita la trei procesoare moderne Prezentarea noastră va fi scurtă, deoarece calculatoarele sunt extrem de complexe, conțin milioane de porți și nu suntem în măsură să oferim o descriere detaliată Exemplele de procesoare sunt aceleași ca înainte - Pentium , UltraSPARC III și Microarhitectura procesorului Pentium La prima vedere, Pentium arată ca o mașină CISC destul de tradițională, cu un set de instrucțiuni mare și greu de manevrat, care acceptă operații cu numere întregi pe , și de biți, precum și operațiuni cu virgulă mobilă pe și de biți Are doar registre disponibile, iar niciunul nu le repetă pe celelalte Lungimea admisă a comenzii este de - octeți În general, există o arhitectură moștenită standard care face totul greșit De fapt, procesorul Pentium se bazează pe un nucleu RISC modern, fiabil, cu pipelining avansat Viteza sa de ceas este deja foarte mare și este probabil să crească și mai mult în următorii ani Este uimitor cum inginerii Intel, bazați pe o arhitectură arhaică, au reușit să construiască un procesor care să îndeplinească toate cerințele moderne Deci, în această subsecțiune, ne vom uita la microarhitectura Pentium și vom înțelege cum funcționează Capitolul Stratul de microarhitectură Prezentare generală a microarhitecturii NetBurst Microarhitectura Pentium , numită NetBurst, a marcat o abatere decisivă de la principiile microarhitecturii P utilizate în procesoarele Pentium Pro, Pentium II și Pentium III Oferă o idee pe ce bază vor fi dezvoltate produsele Intel în următorii câțiva ani O diagramă aproximativă a microarhitecturii Pentium este prezentată în fig Într-o anumită măsură, corespunde cu figura Orez Microarhitectura Pentium Pentium constă din patru blocuri principale: subsistemul de memorie, blocul de preprocesare, blocul de control al execuției de resecvențiere și blocul de execuție Luați în considerare aceste blocuri în ordine, începând din stânga sus și mișcându-se în sens invers acelor de ceasornic Subsistemul de memorie include un cache L combinat, precum și o logică pentru accesarea RAM externă prin magistrala de memorie În prima generație Pentium , L avea KB; în al doilea - KB; în al treilea - MB L este un cache asociativ cu căi cu linii de de octeți Dacă cererea către memoria cache de nivel al doilea eșuează, se fac două transferuri de de octeți în memoria principală, după care sunt selectate blocurile necesare din aceasta Acest cache L aparține categoriei de cache-uri Exemple la nivel de microarhitectură scriere întârziată Cu alte cuvinte, noile date din rândul modificat sunt scrise înapoi în memorie numai după resetare Strâns asociat cu memoria cache este un prefetcher (neprezentat în figură) care încearcă să mute datele din memoria principală în L înainte ca datele să fie solicitate Din L , datele pot fi transferate cu viteză mare către alte blocuri cache O operație de preluare L poate fi efectuată pe ciclu; Deci, la o frecvență de ceas de GHz, până la , miliarde de blocuri de de octeți pe secundă pot fi transferate teoretic din L în alte cache - astfel, debitul devine egal cu GB / s Sub cel prezentat în fig , subsistemul memorie conține o unitate de preprocesare care selectează instrucțiunile din L și le decodifică în ordinea în care sunt executate instrucțiunile programului Fiecare instrucțiune la nivelul ISA este împărțită într-o secvență de micro-opțiuni asemănătoare RISC Pentru a simplifica comenzile, blocul fetch-decode determină ce micro-opțiuni sunt necesare pentru a rezolva problemele interne În cazuri mai complexe, se face o căutare a unei secvențe de micro-operații în memoria micro-instrucțiunilor În orice caz, comanda Pentium ISA este convertită într-o secvență de micro-operații care urmează să fie executate de miezul RISC al cipului Acest mecanism vă permite să "construiți punți" între setul de instrucțiuni CISC moștenit și calea de date RISC modernă Micro-opțiunile decodificate sunt trimise în cache-ul de urmărire, care este memoria cache de instrucțiuni de prim nivel Deoarece nu instrucțiunile originale sunt stocate în cache, ci micro-opțiunile decodificate, nu este nevoie să re-decodați atunci când preluați instrucțiunea din memoria cache de urmărire Aceasta este una dintre cele mai semnificative discrepanțe între microarhitecturile NetBurst și P (în cea din urmă, instrucțiunile Pentium au fost păstrate în memoria cache de instrucțiuni de prim nivel) Predicția ramurilor este, de asemenea, efectuată aici Comenzile sunt transmise din memoria cache de urmărire către planificatorul de comenzi în ordinea determinată de program, dar atunci când sunt executate, sunt posibile abateri de la această ordine Când se găsește un micro-op care nu poate fi executat, planificatorul de instrucțiuni îl reține în timp ce continuă să proceseze fluxul de instrucțiuni - sunt lansate toate instrucțiunile ulterioare care nu implică accesarea resurselor ocupate (registre, blocuri funcționale etc ) Aici se realizează și înlocuirea registrului, astfel încât instrucțiunile interdependente WAR și WAW să poată fi executate fără întârziere După cum sa menționat deja, ordinea în care sunt lansate comenzile poate să nu corespundă cu cea prevăzută în program În același timp, cerința arhitecturii Pentium privind întreruperile precise spune că comenzile ISA trebuie să returneze rezultate fără a se abate de la secvența specificată de program Blocul stațiunii este responsabil pentru implementarea acestei cerințe În partea dreaptă sus a figurii, este afișat un bloc de execuție, care combină blocuri de execuție specializate care efectuează direct operații cu numere întregi, operații în virgulă mobilă și instrucțiuni specializate Există mai multe unități de execuție care rulează în paralel Ei își obțin datele din fișierul de registru și din memoria cache a datelor de la primul nivel Capitolul Stratul de microarhitectură Conducta NetBurst Pe fig Figura prezintă o diagramă mai detaliată a microarhitecturii NetBurst, inclusiv conducta acesteia În partea de sus a diagramei este un bloc de preprocesare responsabil pentru preluarea instrucțiunilor din memorie și pregătirea lor pentru execuție Acest bloc primește noi instrucțiuni Pentium din memoria cache L în bucăți de de biți Ele sunt decodificate în micro-operații și plasate în memoria cache a urmelor Cache-ul de urmărire are o capacitate de µops și este comparabil ca performanță cu un cache L tradițional de K sau K Orez Diagrama de traseu a datelor Pentium simplificată Exemple la nivel de microarhitectură În memoria cache de urmărire, fiecare șase micro-operații sunt combinate într-un grup care ocupă o linie Micro-operațiunile cu o singură linie sunt executate fără a întrerupe secvența, deși pot fi formate din comenzi Pentium ISA la mii de octeți distanță Pentru a forma secvențe mai extinse de micro-operații, se practică îmbinarea șirurilor trasate Dacă o comandă Pentium ISA necesită mai mult de patru micro-operații pentru a fi executată, aceasta nu este decodificată și plasată în memoria cache de urmărire În schimb, este prevăzut cu un marker special care obligă sistemul să caute micro-operații în memoria micro-instrucțiuni Astfel, logica de execuție de resecvențiere obține micro-operații prin preluarea instrucțiunilor ISA decodificate anterior din memoria cache de urmărire sau prin căutarea online a instrucțiunilor ISA complexe (de exemplu, instrucțiuni de schimbare a liniilor) în memoria micro-instrucțiuni La întâlnirea unei comenzi de ramificare necondiționată, decodorul caută obiectul de ramificare prezis în primul nivel Branch Target Buffer (BTB) și continuă decodificarea de la adresa corespunzătoare Cache-ul tampon al obiectului de salt de la primul nivel stochează ultimele de salturi Dacă instrucțiunea de salt necesară nu este în tabel, se aplică predicția statică Aceasta înseamnă că tranziția inversă, în primul rând, face parte din ciclu și, în al doilea rând, nu este ocupată Precizia prognozei statice în acest caz este foarte mare Saltul înainte este considerat neocupat și face parte din structura instrucțiunii if Precizia unei prognoze statice în cazul tranzițiilor directe este mult mai mică decât în cazul celor inversate Pentru a prezice micro-opțiunile de tranziție, este utilizat un buffer de urme ale obiectelor de tranziție sau urme VTB A doua componentă a conductei, logica de execuție de resecvențiere, preia date dintr-un cache de urmărire cu o capacitate de microops Când fiecare microoperație ulterioară sosește din blocul de preprocesare (și sunt trei pe ciclu), blocul de distribuție și substituție o înregistrează într-un tabel format din de intrări și numit buffer de reordonare a comenzii (ReOrder Buffer, ROB) Acest buffer stochează date despre starea micro-operației, până la resortarea rezultatelor acesteia Apoi blocul de distribuție și substituție verifică disponibilitatea resurselor necesare realizării micro-operației Dacă resursele sunt libere, micro-operația este plasată într-una dintre cozile de execuție Sunt furnizate cozi separate pentru micro-operațiunile executate în memorie și în afara memoriei Dacă executarea unei micro-operații este imposibilă în prezent, aceasta se amână, dar procesarea micro-operațiilor ulterioare continuă; astfel, micro-opțiunile sunt adesea executate în afara secvenței lor inițiale Acest principiu vă permite să mențineți încărcarea tuturor blocurilor funcționale la cel mai înalt nivel posibil În orice moment, până la de comenzi pot fi procesate simultan, dintre ele pot fi încărcate din memorie, iar pot fi stocate în memorie Uneori, micro-operatorii sunt inactiv Acest lucru se întâmplă atunci când mai multe micro-opțiuni încearcă să acceseze același registru pentru citire sau scriere; în consecință, unul dintre ei reușește, iar restul - Capitolul Stratul de microarhitectură Nu Astfel de conflicte, după cum am aflat deja, se numesc interdependențe WAR și WAW Înlocuirea registrului țintă vă permite să scrieți rezultatele execuției microoperației într-unul dintre cele de registre temporare, ceea ce înseamnă că puteți executa această microoperație imediat Dacă toate registrele temporare sunt indisponibile sau micro-op intră într-o situație de dependență RAW (care nu poate fi ocolită), planificatorul indică natura problemei sub forma unei intrări în buffer-ul ROB Ulterior, după eliberarea tuturor resurselor necesare, micro-operația este plasată într-una dintre cozile de execuție Blocul de distribuție și înlocuire pune operațiunile pregătite pentru execuție într-una din cele două cozi Patru programatori sunt responsabili pentru extragerea microinstrucțiunilor din cozi Fiecare planificator reglează accesul la anumite resurse: Scheduler - ALU și unitate de offset în virgulă mobilă Scheduler - ALU și un bloc pentru executarea operațiilor în virgulă mobilă Scheduler - descărcați comenzi Scheduler - salvare comenzi Deoarece programatoarele și ALU-urile rulează cu dublul ratei de ceas nominală, primele două programatoare pot transmite două micro-operații pe ciclu Cu două ALU-uri întregi care rulează de asemenea la o viteză de două ori mai mare, procesorul Pentium de GHz este capabil să efectueze miliarde de operații cu numere întregi pe secundă Datorită vitezei atât de mari, unitatea de control al execuției de resecvențiere are unele dificultăți la încărcarea ALU Instrucțiunile de încărcare și stocare trec printr-o singură unitate de execuție, care rulează cu o frecvență dublă, care poate apela o instrucțiune de ambele tipuri în timpul unui ciclu Astfel, în cel mai bun caz (în absența operațiilor în virgulă mobilă), pot fi apelate micro-opțiuni întregi pe ciclu Cele două ALU-uri întregi nu sunt la fel ALU efectuează orice operații și tranziții aritmetice și logice ALU este capabil doar să execute comenzi de adăugare, scădere, deplasare și rotire Cele două blocuri de execuție în virgulă mobilă nu sunt, de asemenea, identice Primul efectuează doar ture și comenzi SSE Al doilea acceptă aritmetica în virgulă mobilă, precum și comenzile MMX și SSE Unitățile de execuție ALU și în virgulă mobilă primesc date din două fișiere de registru cu o capacitate de de intrări Unul dintre aceste fișiere este pentru numere întregi, celălalt pentru numere în virgulă mobilă Acestea conțin toți operanzii necesari executării instrucțiunilor; în plus, ele joacă rolul unui depozit de rezultate Datorită înlocuirii registrelor, opt dintre ele conțin registre accesibile la nivelul arhitecturii instrucțiunilor (EAX, EBX, ECX, EDX etc ), dar locația valorilor "reale" în fiecare caz depinde de modificările în maparea care apar în timpul execuției Cache-ul de date de la primul nivel este una dintre componentele schemei de mare viteză ( x) Cu o capacitate de KB, stochează numere întregi, numere în virgulă mobilă și alte tipuri de date Spre deosebire de memoria cache de urmărire, aceste date nu sunt Exemple la nivel de microarhitectură cumva nu decodificat Funcția cache-ului de date este de a stoca copii ale octeților în memorie În ceea ce privește caracteristicile sale, primul nivel cache de date este un cache asociativ cu căi cu o capacitate de linie de de octeți Acceptă trecerea la scriere; cu alte cuvinte, atunci când o linie de cache se modifică, este imediat copiată înapoi în cache-ul de al doilea nivel În timpul unui ciclu, memoria cache a datelor de la primul nivel procesează o operație de citire și una de scriere Dacă cuvântul solicitat nu poate fi găsit în memoria cache de primul nivel, o solicitare este trimisă în memoria cache de al doilea nivel; acesta din urmă într-o astfel de situație poate răspunde fie imediat, fie după ce a preluat din memorie linia corespunzătoare În orice moment, până la patru interogări pot fi în execuție, direcționate din memoria cache de nivel întâi către memoria cache de nivel al doilea Deoarece micro-opțiunile sunt executate în afara secvenței, stocarea în memoria cache de primul nivel este posibilă numai după resortarea rezultatelor tuturor comenzilor care preced comanda de stocare Această resortare a rezultatelor cu urmărirea lor (ținând evidența unde se află) este realizată de blocul de resortare În cazul unei întreruperi, procesarea tuturor comenzilor care nu au trecut încă de recurgerea rezultatelor este încheiată; în acest fel, este îndeplinită cerința ca întreruperea să completeze toate instrucțiunile până la un anumit punct din program Dacă o comandă de stocare și-a reordonat rezultatele, dar comenzile anterioare sunt încă procesate, rezultatele execuției lor sunt transferate în buffer-ul de comandă în așteptare din cauza imposibilității actualizării cache-ului de prim nivel În acest buffer pot fi plasate până la de comenzi de salvare simultan Dacă una dintre comenzile de încărcare ulterioare încearcă să citească datele stocate, aceasta va fi redirecționată din bufferul de comandă în așteptare direct la comanda care nu este încă plasată în memoria cache de date de la primul nivel în acel moment Acest proces se numește redirecționare de la magazin la încărcare Deci, este destul de evident că Pentium are o microarhitectură complexă, a cărei soluție de proiectare este determinată de necesitatea de a sprijini setul de instrucțiuni Pentium moștenit pe un nucleu RISC modern, cu un nivel ridicat de pipelining Acest obiectiv este atins prin împărțirea instrucțiunilor Pentium în micro-op-uri, memorarea lor în cache și trecerea lor (trei micro-op-uri la un moment dat) către conductă, unde sunt executate de mai multe ALU-uri, care, în condiții optime, procesează până la șase micro-operații -ops pe ciclu Micro-opțiunile sunt executate în afara secvenței, dar sunt returnate și stocate în cache-urile de primul și al doilea nivel, în ordinea specificată Informații mai detaliate despre microarhitectura NetBurst sunt prezentate în [ ] Microarhitectura procesorului UltraSPARC III Cu Seria de procesoare UltraSPARC de la Sun este o implementare a versiunii a arhitecturii SPARC La prima vedere, toate modelele sunt foarte asemănătoare și diferă în principal în ceea ce privește performanța și prețul În același timp, la nivel de microarhitectură, ele diferă semnificativ În această secțiune noi Capitolul Stratul de microarhitectură Să discutăm despre procesorul UltraSPARC III Cu Abrevierea "Cu" din numele modelului indică faptul că conductorii microcircuitului sunt din cupru - spre deosebire de conductorii de aluminiu utilizați în modelele anterioare Rezistența cuprului este mai mică decât rezistența aluminiului, din această cauză firele devin mai subțiri, iar viteza este mai mare UltraSPARC III Cu este o mașină pe de biți cu registre de de biți și o cale de date pe de biți, dar pentru compatibilitate cu mașinile Versiunea (care sunt pe de biți), poate funcționa pe operanzi pe de biți și software scris pentru versiunile pe de biți ale SPARC, nu este necesară nicio modificare Deși arhitectura internă a mașinii folosește de biți, magistrala de memorie are o lățime de de biți, similar unui procesor Pentium II cu o arhitectură de de biți și o magistrală de memorie de de biți În ambele cazuri, în același sistem sunt instalate o magistrală și un procesor de generații diferite Spre deosebire de Pentium , procesorul UltraSPARC a fost conceput inițial ca un sistem RISC complet Prin urmare, nu a fost nevoie de un mecanism complex pentru convertirea vechilor comenzi CISC în micro-operații în acest caz Comenzile kernelului sunt micro-opțiuni gata făcute Situația este oarecum complicată de apariția în ultimii ani a unor noi comenzi pentru procesarea datelor grafice și multimedia, care necesită dispozitive speciale pentru a fi executate Prezentare generală a sistemului UltraSPARC III Cu Diagrama structurală a UltraSPARC III Cu este prezentată în fig În general, este mult mai simplă decât microarhitectura NetBurst utilizată în sistemele Pentium , datorită arhitecturii mai puțin sofisticate a setului de instrucțiuni UltraSPARC Cu toate acestea, unele componente de bază sunt similare cu Pentium În primul rând, acest lucru se datorează factorilor tehnologici și economici De exemplu, în perioada de proiectare a acestor microcircuite, volumul cache-urilor de date ale primului a fost de la la KB Ambele microcircuite considerate corespundeau acestui standard Atunci când producerea memoriei cache L cu o capacitate de MB devine justificată din punct de vedere tehnologic și economic, toate procesoarele vor fi echipate cu noi cache-uri Diferențele dintre Pentium și UltraSPARC III Cu sunt legate în principal de faptul că, în primul caz, dezvoltatorii au trebuit să ofere suport pentru setul moștenit de comenzi CISC, în timp ce în al doilea, o astfel de sarcină nu a fost stabilită În partea din stânga sus a Fig Figura prezintă un cache de instrucțiuni asociative cu căi de K cu linii de de octeți Deoarece majoritatea instrucțiunilor UltraSPARC au octeți, aproximativ de instrucțiuni pot fi plasate în acest cache la un moment dat Pe această bază, UltraSPARC III Cu este oarecum inferior cache-ului de urmărire NetBurst Blocul de apel de comandă pregătește până la patru comenzi pe ciclu pentru execuție În cazul accesului nereușit la memoria cache a primului nivel, numărul de comenzi apelate este redus Când este detectat un salt condiționat, este accesat un tabel de salt cu o capacitate de de intrări; pe baza conținutului său, se ia decizia de a apela următoarea comandă sau comanda situată la adresa țintă Îmbunătățiți fiabilitatea prognozei Exemple la nivel de microarhitectură ramificarea este ajutată de biți suplimentari asociați cu fiecare cuvânt din memoria cache a instrucțiunilor Comenzile pregătite intră în buffer-ul cu comenzi, care uniformizează fluxul de comenzi direcționate către conducte Orez Diagrama structurală a procesorului UltraSPARC III Cu După cum se arată în fig , din bufferul de comenzi, comenzile intră în blocul pentru executarea operațiilor întregi, blocul pentru executarea operațiilor în virgulă mobilă și blocul încărcare/salvare Blocul de execuție a operațiunilor întregi este format din două ALU și o conductă scurtă pentru procesarea comenzilor de tranziție În plus, există registre ISA și registre temporare Blocul de execuție în virgulă mobilă este format din de registre și trei ALU independente pentru efectuarea operațiilor de adunare/scădere, înmulțire și, respectiv, împărțire Același bloc realizează operații grafice Blocul de încărcare/salvare, după cum sugerează și numele, este responsabil pentru gestionarea diferitelor comenzi de încărcare și stocare Căile de date pe care le conține oferă conexiuni la trei cache-uri Cache-ul de date este un cache convențional asociativ cu căi de prim nivel, cu o capacitate de KB și o lungime de linie de de octeți Cache-ul de preluare prealabilă de K este necesar deoarece stratul de arhitectură de instrucțiuni UltraSPARC oferă instrucțiuni de preluare preliminară care permit compilatorului să apeleze cuvinte înainte de a fi necesare Dacă compilatorul crede că va avea nevoie de un anumit cuvânt după un timp, rulează comanda prefetch Ca rezultat, rândul corespunzător este preîncărcat în memoria cache de prefatch și după Capitolul Stratul de microarhitectură mai multe comenzi care accesează această linie este semnificativ mai rapidă decât dacă nu ar fi fost încărcată În unele situații, se realizează și preîncărcarea hardware, ceea ce face posibilă creșterea vitezei programelor moștenite care nu acceptă preluarea preliminară a software-ului Cache-ul de scriere este un bloc mic ( KB) de memorie cache conceput pentru a combina rezultatele unei scrieri și, prin urmare, pentru a optimiza consumul de resurse al magistralei late ( de biți) care duce la cache-ul de al doilea nivel Singurul scop al memoriei cache de scriere este de a îmbunătăți performanța Cipul UltraSPARC III Cu include, de asemenea, logica de control al accesului la memorie Este format din trei componente: o interfață de sistem, un controler cache de nivel al doilea și un controler de memorie Interfața sistemului asigură interacțiunea cu memoria printr-o magistrală de de biți Toate cererile către exterior trec prin această interfață, cu excepția solicitărilor către cache-ul de al doilea nivel Teoretic, atunci când se utilizează adrese de memorie fizică pe de biți, memoria principală poate fi de până la TB, dar dimensiunea plăcii de circuit imprimat pe care este instalat procesorul limitează această cifră la GB Soluția de proiectare a interfeței vă permite să conectați mai multe procesoare UltraSPARC la un singur modul de memorie simultan, formând astfel un multiprocesor Multiprocesoarele vor fi discutate în capitolul Controlerul cache L interfață cu un cache L integrat care este situat în afara cipul procesorului Cu plasarea externă a cache-ului de al doilea nivel, volumul acestuia poate fi de , sau chiar MB Lungimea liniei depinde de dimensiunea memoriei cache (de la de octeți într-un cache de MB la octeți într-un cache de MB) Amintiți-vă că memoria cache Pentium L se află pe cip și, din cauza lipsei de spațiu liber pe acesta, volumul său este limitat la MB Astfel, UltraSPARC oferă un raport de accesare a cache-ului semnificativ mai mare decât Pentium (datorită dimensiunii mari a cache-ului), dar viteza de acces este mai mică aici (deoarece cache-ul este situat în afara cipului) Controlerul de memorie convertește adresele virtuale de de biți în adrese fizice de de biți UltraSPARC acceptă memoria virtuală (vezi capitolul ) cu dimensiuni de pagină de , și KB, precum și MB Pentru a accelera procesul de conversie, sunt furnizate tabele speciale numite Translation Lookaside Buffers (TLB) Ei compară adresa virtuală actuală cu adresele care au fost accesate în trecutul recent Trei dintre aceste tabele oferă control flexibil asupra dimensiunilor paginilor de date și alte două gestionează comenzile de conversie Transportor UltraSPARC III Cu Transportorul UltraSPARC III Cu în trepte este prezentat în formă simplificată în fig În partea stângă a figurii, pașii sunt marcați cu litere de la A la D Să luăm în considerare fiecare dintre ei separat Deschide treapta transportoare A (Generarea adresei - generarea adresei) Aceasta definește adresa fiecărei comenzi ulterioare care ar trebui să fie selectată De regulă, coincide cu adresa următoarei instrucțiuni, totuși, în unele cazuri, organizarea secvențială este întreruptă, de exemplu, dacă instrucțiunea anterioară este instrucțiunea Exemple la nivel de microarhitectură o ramură prezisă, o capcană de excepție sau o întrerupere care trebuie gestionată Deoarece nu este posibil să se prezică ramificarea într-un ciclu, instrucțiunea imediat următoare ramificației condiționate este oricum executată, indiferent de ținta ramificației Orez Diagrama simplificată a transportorului UltraSPARC III Cu Capitolul Stratul de microarhitectură Pe baza adresei definite anterior la etapa P (Preluare preliminară - preluare preliminară), comenzile sunt apelate din memoria cache a comenzilor de la primul nivel (până la patru per ciclu) Pentru a identifica săriturile condiționate și pentru a verifica corectitudinea prognozei, se fac apeluri către tabelul de sărituri Etapa F (Fetch) finalizează preluarea instrucțiunilor și transferul lor în memoria cache a instrucțiunilor La etapa B (Ținta de ramificație - detectarea obiectului de tranziție), comenzile selectate sunt decodificate Dacă între ele se găsesc tranziții prezise, acestea sunt trecute înapoi în etapa A pentru preluarea imediată a instrucțiunilor corespunzătoare În etapa I (formarea grupului de instrucțiuni), comenzile primite sunt sortate în grupuri, în funcție de care dintre cele șase blocuri funcționale se referă: ALU pentru a efectua operații cu numere întregi ALU pentru efectuarea de operații cu numere întregi ALU pentru operații în virgulă mobilă și grafice ALU pentru operații în virgulă mobilă și grafice Conducta de tranziție (nu este prezentată în Fig ) Operațiuni de încărcare și depozitare, precum și operațiuni speciale Există diferențe notabile atât între ALU-uri pentru efectuarea de operații cu numere întregi, cât și între ALU-uri pentru efectuarea operațiilor în virgulă mobilă și grafice În ambele cazuri, există seturi diferite de instrucțiuni pe care anumite ALU-uri sunt capabile să le execute Sortarea comenzilor în blocuri se realizează în etapa I La etapa J (Gruparea etapei instrucțiunilor - extragerea unei comenzi din coadă), comenzile sunt pregătite pentru a fi trimise blocului de execuție în timpul următorului ciclu Până la patru comenzi pot fi trimise la etapa R în timpul unui ciclu Alegerea comenzilor este limitată de disponibilitatea blocurilor funcționale De exemplu, puteți apela două instrucțiuni de operare cu numere întregi, o instrucțiune de operare în virgulă mobilă și o instrucțiune de încărcare sau stocare în același timp Cu toate acestea, este imposibil să rulați trei instrucțiuni pentru a efectua operații cu numere întregi într-un singur ciclu La etapa R (Registrul - registru) caută registrele necesare procesării instrucțiunilor pentru efectuarea operațiilor cu numere întregi Solicitările de furnizare de registre în virgulă mobilă sunt redirecționate către fișierul de registru corespunzător De asemenea, verifică existența interdependențelor Dacă registrul necesar nu este disponibil deoarece a fost ocupat de instrucțiunea anterioară, instrucțiunea curentă este suspendată și toate instrucțiunile ulterioare sunt blocate Spre deosebire de Pentium , UltraSPARC III Cu nu execută comenzi în afara secvenței Etapa E (Execuție - execuție) este destinată executării directe a comenzilor întregi Majoritatea operațiunilor aritmetice, booleene și de schimbare gestionate de ALU-uri întregi durează un ciclu pentru a fi finalizate De îndată ce comanda este finalizată, fișierul de înregistrare este actualizat în consecință Exemple la nivel de microarhitectură registru de lucru Unele comenzi întregi complexe sunt transmise unui bloc special În ceea ce privește comenzile de încărcare și salvare, în această etapă execuția lor începe doar, dar nu se termină Operanzii pentru executarea unei instrucțiuni în virgulă mobilă sunt preluați din fișierul de registru corespunzător La etapa £, pe lângă procesarea instrucțiunilor de sărituri condiționate, este determinată direcția acestora (săritură/fără sărituri) Dacă predicția este incorectă, semnalul este trimis înapoi la etapa L și conducta este eliberată La etapa C (Cache - cache), accesul la memoria cache a primului nivel este finalizat Rezultatele comenzilor care implică citirea datelor din memorie (de exemplu, comenzi de încărcare) sunt, de asemenea, definite aici Etapa M (Miss) procesează cuvintele solicitate, dar care nu au fost găsite în memoria cache de primul nivel În primul rând, se caută cache-ul de al doilea nivel, iar în cazul pierderii cache-ului, se efectuează un acces la memorie, care durează mai multe cicluri De asemenea, efectuează operații de extindere și aliniere a semnelor pentru octeți, sferturi de cuvinte și jumătate de cuvinte găsite în memoria cache de primul nivel Pentru operațiunile de încărcare în virgulă mobilă care au o lovitură de cache în memoria cache de preluare prealabilă, rezultatele pot fi preluate în acest moment Din motive de sincronizare, memoria cache de preluare preliminară nu este utilizată la procesarea datelor întregi La etapa W (Write - record), rezultatele sunt extrase dintr-un bloc special și scrise în fișierul de registru al registrului de lucru Etapa X (eXtend - Execuție extinsă) completează majoritatea graficelor și comenzilor în virgulă mobilă Înainte de resortarea formală a rezultatelor care are loc în pasul D, rezultatele acestor comenzi sunt furnizate comenzilor ulterioare prin redirecționare pentru descărcare La etapa T (Capcană - interceptare), sunt interceptate excepțiile asociate cu instrucțiuni întregi și instrucțiuni în virgulă mobilă Această etapă este responsabilă pentru capturarea excepțiilor și gestionarea întreruperilor Cu alte cuvinte, după apariția unei excepții sau a unei întreruperi, starea mașinii trebuie să îndeplinească anumite cerințe; în special, toate comenzile executate anterior trebuie să fie terminate, iar cele ulterioare anulate În etapa D, starea registrelor întregi și virgulă mobilă este capturată în fișierele de registru arhitectural corespunzătoare Când apare o excepție sau o întrerupere, aceste valori devin vizibile și nu conținutul registrelor de lucru Operația de scriere a unui registru într-un fișier arhitectural corespunde operației de recurgere a rezultatelor în procesoare Pentium În plus, în etapa D, rezultatele tuturor comenzilor de stocare finalizate sunt scrise în memoria cache de scriere (în locul cache-ului de date de la primul nivel) În cele din urmă, liniile acestui cache sunt scrise în cache-ul de al doilea nivel, ocolind cache-ul de prim nivel (conținutul său nu se suprapune cu conținutul cache-ului de al doilea nivel) Această schemă simplifică sarcina de a construi multiprocesoare UltraSPARC Descrierea noastră a cipului UltraSPARC III nu este exhaustivă, dar este suficientă pentru a vă oferi o idee despre cum funcționează și cum diferă de arhitectura Pentium Capitolul Stratul de microarhitectură Microarhitectura procesorului Microarhitectura procesorului (Fig ) este mult mai simplă decât precedentele două - Pentium și UltraSPARC Faptul este că dimensiunea acestui microcircuit este foarte mică (este format din de tranzistori) și a fost dezvoltat cu mult înainte ca tehnologia conductelor să devină populară În plus, dezvoltatorii au fost însărcinați să creeze un cip ieftin, nu rapid După cum știți, "ieftin" și "simplu" sunt concepte foarte apropiate, în timp ce ieftinitatea și viteza în contextul nostru sunt rareori combinate Autobuzul principal Orez Microarhitectura procesorului Centrală pentru microarhitectura este autobuzul principal Câteva registre îi sunt asociate, iar pentru majoritatea acestora, operațiunile de citire și scriere sunt efectuate de software Înregistrați reprezentantul ACC Exemple la nivel de microarhitectură Este principalul registru aritmetic în care sunt stocate majoritatea rezultatelor calculelor Aproape toate comenzile aritmetice trec prin el Registrul B este folosit pentru înmulțire și împărțire; în plus, la stocarea rezultatelor, acesta acționează ca un registru temporar Registrul SP este indicatorul stivei, la fel ca în majoritatea celorlalte sisteme, acesta indică vârful stivei Registrul de instrucțiuni IR conține instrucțiunile în curs de executare Registrele TMP și TMP sunt zăvoarele care servesc ALU Înainte de a executa operațiuni în ALU, operanzii corespunzători sunt copiați în aceste latch-uri Rezultatele calculelor din ALU sunt scrise în orice registru de scriere, la care accesul este asigurat de magistrala principală Codurile de stare care indică zero, negativ și altele asemenea sunt scrise în registrul PSW (Program Status Word) oferă module de memorie independente pentru stocarea datelor și a codului Capacitatea RAM pentru plasarea datelor este de (Model ) sau (Model ) octeți; în consecință, un registru RAM ADDR de biți este suficient pentru adresarea completă a acestei memorie În procesul de adresare RAM, adresa octetului țintă este plasată în registrul RAM ADDR, după care se accesează memoria Capacitatea memoriei codului poate ajunge la KB (cu condiția ca modulul de memorie să fie plasat în afara cipului), astfel încât registrul ROM ADDR are o lățime de biți Schema de adresare pentru codul programului din ROM folosind registrul ROM ADDR este similară cu schema de mai sus pentru memoria de date Registrul DPTR (Double Pointer) este un registru temporar de biți pentru gestionarea și asamblarea adreselor pe biți Registrul PC-ului este un numărător de programe pe biți; cu alte cuvinte, specifică adresa următoarei instrucțiuni care urmează să fie apelată și executată Registrul de incrementare a PC-ului este un modul hardware special care acționează ca un pseudo-registru Când conținutul registrului PC este copiat în el și apoi citit, valoarea acestuia este automat incrementată cu unu Nici PC-ul, nici incrementerul PC-ului nu pot fi accesate prin magistrala principală În cele din urmă, BUFFER este un alt registru temporar de biți De fapt, fiecare registru de biți din procesorul este format dintr-o pereche de registre de biți, fiecare dintre acestea putând fi operat într-un mod diferit În plus, are trei temporizatoare pe biți necesare pentru aplicațiile în timp real Există, de asemenea, patru porturi I/O pe biți prin care procesorul poate controla până la de butoane externe, lumini indicatoare, senzori, comutatoare etc Prezența temporizatoarelor și a porturilor I/O este cea care face posibilă utilizarea ca procesor încorporat fără a instala microcipuri suplimentare Procesorul este clasificat ca fiind sincron - majoritatea comenzilor pe care le procesează sunt finalizate într-un singur ciclu Fiecare ciclu este împărțit în șase părți numite stări În prima stare, următoarea comandă este apelată din ROM și este trimisă prin magistrala principală către re Capitolul Stratul de microarhitectură hyster IR În a doua stare, această comandă este decodificată, iar valoarea din registrul RS este mărită cu unu În a treia stare, operanzii sunt pregătiți; în al patrulea, unul dintre ele este transferat pe magistrala principală, după care, de regulă, este plasat în registrul TMP și acționează ca un operand ALU În aceeași stare, este posibil să copiați conținutul ACC în registrul TMP , după care ambele ALU-uri devin gata pentru procesare ulterioară În a cincea stare, comenzile ALU sunt executate În cele din urmă, în a șasea stare, rezultatele comenzilor ALU sunt trimise înapoi la magistrala principală În același timp, registrul ROM ADDR se pregătește să apeleze următoarea instrucțiune Dispozitivul ar putea fi descris mai detaliat, cu toate acestea, descrierea și circuitul disponibile prezentate în fig este suficient pentru a vă face o idee generală În rezumat, constă dintr-o magistrală principală (reducând astfel dimensiunea cipului), un set eterogen de registre, trei temporizatoare și patru porturi conectate la magistrala principală, precum și mai multe registre suplimentare conectate la magistrala locală În timpul fiecărui ciclu al căii de date, cele două ALU-uri primesc câte un operand ca intrare, după care, ca în sistemele mai moderne, rezultatele sunt stocate într-un registru Comparație între procesoarele Pentium, UltraSPARC și Aceste trei procesoare diferă unul de celălalt în multe privințe, dar au o caracteristică surprinzătoare care poate ajuta la proiectarea unui computer Pentium acceptă un set de instrucțiuni CISC vechi pe care inginerii Intel ar fi bucuroși să îl arunce în cel mai apropiat corp de apă, dar cu siguranță ar încălca legile de mediu UltraSPARC III este un sistem RISC clasic cu un set de instrucțiuni eficient este un procesor simplu de biți folosit ca computer încorporat Toate exemplele prezentate se bazează pe un set de registre și una sau mai multe ALU-uri care efectuează operații aritmetice și booleene simple pe operanzi din registre În ciuda diferențelor, toate cele trei mașini au blocuri funcționale similare Toate blocurile funcționale primesc micro-operații, care conțin codul de funcționare și indică, de asemenea, două registruri de intrare și unul de ieșire Toate pot efectua o micro-operație într-un singur ciclu Toate sunt canalizate și suportă predicția ramurilor În cele din urmă, toate conțin cache-uri separate de instrucțiuni și date Această asemănare internă nu este întâmplătoare; nu este deloc transferurile constante de ingineri de la o companie din Silicon Valley la alta Când ne-am uitat la microarhitecturile Mis- și Mis- , am văzut că este destul de simplu să construim o cale de date canalizată cu două registre ca surse, în care valorile acestor registre sunt trecute prin ALU și rezultatul este stocat în registru Pe fig este reprezentat grafic Rezumatul capitolului imaginea unui astfel de transportor Pentru tehnologia modernă, acesta este cel mai eficient sistem Principala diferență dintre Pentium și UltraSPARC III este modul în care comenzile ISA sunt transmise blocului funcțional Computerul Pentium trebuie să împartă instrucțiunile CISC pentru a le converti în formatul cu registre cerut de blocul funcțional Acest proces este prezentat în Fig - împărțirea comenzilor mari în micro-operații mici Aparatul UltraSPARC III nu trebuie să facă nimic, deoarece instrucțiunile sale sursă sunt deja micro-opțiuni convenabile și compacte Acesta este motivul pentru care majoritatea noilor arhitecturi ISA sunt de tip RISC, care oferă combinația optimă între setul de instrucțiuni și mecanismul de execuție intern Este util să comparăm cea mai recentă dezvoltare a noastră, microarhitectura Mis- , cu aceste trei mașini reale Mis- seamănă cel mai mult cu Pentium Ambele sisteme interpretează comenzi care nu sunt comenzi RISC Pentru a face acest lucru, ambele sisteme împart instrucțiunile în micro-operații, care indică codul de operare, două registru de intrare și unul de ieșire În ambele cazuri, micro-operațiunile sunt puse în coadă pentru execuții ulterioare În Міс- , micro-operațiile sunt începute strict în ordine, executate strict în ordine și, de asemenea, sunt finalizate strict în ordine În Pentium, micro-operații sunt pornite în ordine, executate în ordine aleatorie și finalizate din nou în ordine Nu este corect să compari Mis- și UltraSPARC III, deoarece instrucțiunile de sistem UltraSPARC III sunt instrucțiuni RISC (adică micro-opțiuni cu registre) Ele nu trebuie să fie împărțite sau combinate Ele pot fi executate așa cum sunt, fiecare într-un ciclu de cale de date În comparație cu Pentium și UltraSPARC III, este foarte simplu Microarhitectura sa seamănă mai mult cu RISC decât cu CISC, deoarece instrucțiunile simple sunt executate într-un singur ciclu, fără a fi împărțite în părți componente În nu sunt furnizate nici pipeline, nici stocarea în cache Comenzile sunt executate, executate și returnează rezultatele în ordine În simplitatea sa, procesorul seamănă cu Mis- Rezumatul capitolului Componenta principală a oricărui computer este calea datelor Conține mai multe registre, una, două sau trei magistrale și unul sau mai multe blocuri funcționale, cum ar fi un ALU și un schimbător În bucla principală, mai mulți operanzi sunt apelați din registre și trecuți pe magistrală către ALU și alte blocuri funcționale pentru execuție După finalizarea operației, rezultatele sunt din nou stocate în registre Calea datelor poate fi controlată de un secvențior care apelează microinstrucțiuni din memoria de control Fiecare microinstrucțiune conține biți care controlează calea datelor pentru un ciclu Acești biți determină ce operanzi să selecteze, ce operație să efectueze și ce să facă cu rezultatele În plus, fiecare microinstrucțiune indică către următoarea Capitolul Stratul de microarhitectură microinstrucțiune (de obicei conține adresa sa) Unele microinstrucțiuni modifică această adresă de bază folosind operația OR IJVM este o mașină stivuitoare cu coduri operaționale pe un singur octet care împing cuvinte pe stivă, scot cuvintele din stivă și efectuează diverse operații asupra cuvintelor din stivă (cum ar fi adăugarea lor) Acest capitol descrie firmware-ul pentru microarhitectura Mis- Prin adăugarea unei unități de preluare a instrucțiunilor pentru a încărca instrucțiuni dintr-un flux de octeți, un număr mare de accesări la contorul de instrucțiuni poate fi eliminat, iar viteza mașinii va crește semnificativ Există multe abordări pentru organizarea nivelului de microarhitectură, inclusiv o structură cu sau magistrale, câmpuri de microinstrucțiuni codificate sau decodificate, prezența sau absența unui apel anticipat, o conductă cu mai multe sau mai puține etape etc Mic- este o mașină simplă cu control program, execuție secvențială a comenzilor și absență completă a paralelismului Mis- , în schimb, este o microarhitectură cu un grad ridicat de paralelism și o conductă în etape Performanța computerului poate fi îmbunătățită în mai multe moduri, principalul fiind utilizarea memoriei cache Cache-urile mapate direct și cache-urile asociative cu acces multiplu permit accesări mai rapide la memorie Pe lângă utilizarea memoriei cache, sunt folosite predicția de ramuri (atât statice, cât și dinamice), execuția reflow și execuția de instrucțiuni speculative Cele trei procesoare ale noastre, Pentium , UltraSPARC III și , ca exemple, sunt similare prin faptul că microarhitecturile lor nu sunt evidente pentru programatori care scriu în limbaj de asamblare la nivel arhitectural Pentium implementează o schemă complexă de conversie a instrucțiunilor ISA în micro-operații, memorarea lor în cache, trecerea lor către nucleul RISC superscalar pentru execuție în afara secvenței, înlocuirea registrului și aplicarea tuturor celorlalte trucuri descrise în această carte pentru a overclock hardware-ul către cea mai mare viteză posibilă În ceea ce privește procesorul UltraSPARC III Cu, cu excepția conductei în mai multe etape, microarhitectura sa este destul de simplă: lansarea și executarea comenzilor, precum și primirea rezultatelor acestora, sunt efectuate fără modificarea secvenței comenzilor Procesorul este extrem de simplu - mai multe registre și un ALU sunt conectate la o magistrală principală Întrebări și sarcini În fig registrul magistralei B este codificat printr-un câmp de biți și magistrala C este reprezentată ca o hartă de biți De ce? În fig există un bloc "Most bit" Schițați-l Când câmpul JMPC este setat în microinstrucțiune, MBR este OR către câmpul NEXT ADDRESS pentru a obține adresa următoarei microinstrucțiuni Există circumstanțe în care Întrebări și sarcini Are sens să utilizați câmpul JMPC dacă NEXT ADDRESS conține valoarea x FF? Să presupunem că Lista are următoarea instrucțiune după instrucțiunea if: k = : Care va fi noul cod de asamblare, cu condiția ca compilatorul să se optimizeze? Scrieți două traduceri IJVM diferite ale următoarei instrucțiuni Java: = k + n + ; Scrieți în Java instrucțiunea care a devenit sursa următorului cod pentru IJVM: ÎNCĂRCARE j ÎNCĂRCARE k ISUB BIPUSH ISUB DUP ADAUG ISTORE În acest capitol, am menționat că la conversia următoarei instrucțiuni în formă binară, eticheta L trebuie să fie printre cele de cuvinte inferioare ale memoriei de control: dacă (Z) merge la LI; altfel mergi la L Eticheta LI poate fi, de exemplu, în celula cu adresa x și L în celula cu adresa x ? Explică de ce În microcomanda if cmpeq a microprogramului pentru Міс- , valoarea registrului MDR este copiată în registrul H, iar în rândul următor se scade valoarea registrului TOS din acesta S-ar părea că este mai convenabil să o scrieți într-o singură declarație: f cmpeq Z=MDR-TOS; rd De ce nu o fac? Cât timp va dura ca mașina Mis- , care funcționează la o frecvență de , GHz, să execute următorul operator Java: = j + k; Dați răspunsul în nanosecunde O intrebare asemanatoare, doar pentru aparatul Mis- , care functioneaza si la o frecventa de , GHz Pe baza rezultatului obținut, răspundeți, cât timp va dura să executați programul pe mașina Mis- dacă acest program este executat pe mașina Mis- în ns? I Scrieți firmware-ul Mic- pentru a implementa comanda POPTWO JVM Această comandă elimină primele două cuvinte din stivă Capitolul Stratul de microarhitectură Pe JVM, există coduri operaționale speciale de un octet pentru încărcarea variabilelor locale de la la în stivă, care sunt utilizate în locul comenzii normale ILOAD Ce modificări trebuie făcute mașinii IJVM pentru a utiliza cât mai bine aceste comenzi? Comanda ISHR (Integer Arithmetic Right Shift) este acceptată de JVM, dar nu este acceptată de IJVM Comanda scoate primele două cuvinte din stivă și le înlocuiește cu un singur cuvânt (rezultat) Al doilea cuvânt de stivă de sus este operandul care trebuie mutat Este deplasat la dreapta cu o valoare între și , inclusiv, în funcție de valoarea celor mai puțin semnificativi cinci biți ai cuvântului de sus din stivă (cei de biți rămași sunt ignorați) Bitul de semn este duplicat la dreapta cu același număr de biți ca și deplasarea Codul operațional pentru comanda ISHR este ( x A) Comanda ISHL (Integer Shift Left) este acceptată de JVM, dar nu este acceptată de IJVM Comanda scoate primele două cuvinte din stivă și le înlocuiește cu o singură valoare (rezultat) Al doilea cuvânt din stiva de sus este operandul care trebuie mutat Este deplasat la stânga cu o valoare între și , inclusiv, în funcție de valoarea celor mai puțin semnificativi cinci biți ai cuvântului de sus din stivă (ceilalți biți ai cuvântului de sus sunt ignorați) Zerourile sunt deplasate la stânga cu același număr de biți ca și deplasarea Codul operațional ISHL este ( x ) Comanda INVOKEVIRTUAL JVM trebuie să știe câți parametri are Pentru ce? Implementați comanda DLOAD JVM pentru Міс- Această comandă conține un index de un octet și împinge variabila locală din acea locație în stivă Apoi împinge următorul cuvânt cel mai înalt în stivă Desenați o mașină de stat pentru a marca un joc de tenis Regulile tenisului sunt următoarele Pentru a câștiga, trebuie să obții cel puțin puncte și să ai cu cel puțin puncte mai mult decât adversarul tău Începeți cu starea ( , ), ceea ce înseamnă că niciunul dintre voi nu are încă puncte Apoi adăugați o stare ( , ) care indică faptul că jucătorul A a marcat un punct Etichetați marginea de la starea ( , ) la starea ( , ) ca A Apoi adăugați starea ( , ) pentru a arăta că jucătorul B a marcat un punct și etichetați marginea în starea ( , ) ca B Continuați să adăugați stări și margini până când ați desenat toate stările posibile Reveniți la întrebarea anterioară Există stări care pot fi eliminate fără durere, fără a afecta rezultatul vreunui joc? Dacă da, care sunt echivalente? Desenați o mașină de stări de predicție a ramurilor care este mai fiabilă decât cea prezentată în Figura Ar trebui să schimbe predicția numai după trei predicții consecutive nereușite Registrul de deplasare prezentat în fig are o capacitate maximă de octeți Este posibil să construiți o unitate de preluare a instrucțiunilor cu un registru de deplasare de octeți? Și cu octeți? Întrebarea anterioară este legată de reducerea costului unității de preluare a instrucțiunilor Acum luați în considerare problema creșterii prețului Ar putea avea nevoie vreodată de o schimbare Întrebări și sarcini un registru nou cu o capacitate mai mare, să zicem octeți? Dacă da, de ce? Dacă nu, de ce nu? În microprogramul pentru microarhitectura Mic- , microinstrucțiunea f icmpeq sare la T dacă bitul Z este setat la Totuși, microinstrucțiunea T este aceeași ca pentru gotol Este posibil să treceți imediat la gotol și va funcționa mașina mai repede după aceea? În microarhitectura Mis- , blocul de decodare mapează opcode IJVM la indexul ROM, unde sunt stocate microop-urile corespunzătoare Se pare că ar fi mai ușor să săriți peste etapa de decodare și să puneți imediat în coadă codul operațional IJVM Apoi puteți utiliza codul operațional IJVM ca index în ROM-ul micro-op, la fel ca în microarhitectura Mic- Ce este greșit în acest sens? Computerul conține o memorie cache cu două niveluri Să presupunem că % din accesările la memorie sunt accesări cache L , % sunt accesări cache L și % sunt rateuri cache Timpii de acces sunt de , și, respectiv, ns, cu timpii de acces la memoria cache L și la memoria principală numărați din momentul în care se știe că este necesară memoria corespunzătoare (de exemplu, accesul la cache L nu poate începe) apare) Care este timpul mediu de acces? La sfârșitul subsecțiunii "Cache" din secțiunea "Îmbunătățirea performanței", s-a remarcat că completarea cu scrierea este benefică numai dacă există scrieri repetate pe aceeași linie de cache Și ce se întâmplă dacă mai multe lecturi din aceeași linie urmează scrierea? Va fi utilă completarea după înregistrare în acest caz? În versiunea în schiță a acestei cărți din fig , în loc de un cache asociativ cu căi, a fost afișat un cache asociativ cu căi Un recenzent a declarat că cititorii ar putea fi confuzi de acest lucru, deoarece nu este o putere a doi, iar computerele fac totul în binar Deoarece consumatorul are întotdeauna dreptate, designul a fost schimbat într-un cache asociativ cu căi A avut dreptate recenzentul? Argument Un computer cu o conductă în cinci etape după procesarea unei ramuri condiționate este inactiv pentru următoarele trei cicluri Cât de mult va afecta această perioadă de nefuncționare dacă % dintre instrucțiuni sunt instrucțiuni de ramură condiționată? Alte motive pentru timpul de nefuncționare sunt ignorate Să presupunem că computerul apelează până la de comenzi în avans În medie, dintre acestea sunt instrucțiuni de ramură condiționată, fiecare cu o șansă de % de a prezice corect Care este probabilitatea ca comanda invocată anterior să fie pe una dintre căile corecte? Să presupunem că trebuie să schimbăm structura mașinii, prezentată folosind Tabelul pentru a folosi registre în loc de Apoi schimbăm instrucțiunea în registrul țintă R Ce se va întâmpla în acest caz în ciclurile începând cu ciclul ? Capitolul Nivel de microarhitectură Interdependențele fac de obicei dificile procesoarele pipeline Se poate face ceva în legătură cu dependențele WAW pentru a îmbunătăți lucrurile? Care sunt instrumentele de optimizare? Rescrieți interpretorul Mic- astfel încât registrul LV să indice prima variabilă locală, și nu către pointerul de legătură Scrieți un simulator pentru un cache cu cartografiere directă unică Faceți numărul de elemente și lungimea parametrilor șirului programului Experimentați cu acest program și prezentați rezultatele capitolul Stratul de arhitectură set de instrucțiuni Acest capitol discută în detaliu nivelul arhitecturii setului de instrucțiuni (ISA) După cum se arată în fig , este situat între nivelul microarhitecturii și cel al sistemului de operare Din punct de vedere istoric, acest nivel s-a dezvoltat înaintea tuturor celorlalte niveluri și a fost inițial singurul În zilele noastre, acest nivel este deseori denumit "arhitectura" mașinii și uneori (incorect) "limbajul de asamblare" Nivelul arhitecturii setului de instrucțiuni este de o importanță deosebită: este legătura dintre software și hardware Desigur, s-ar putea face ca hardware-ul să execute direct programe scrise în C, C++, Java sau alte limbaje de nivel înalt, dar aceasta nu este o idee bună Avantajul compilarii fata de interpretare s-ar pierde atunci În plus, din motive pur practice, computerele ar trebui să poată executa programe scrise în diferite limbi, nu doar una De fapt, toți dezvoltatorii consideră că este necesar să se traducă programele scrise în diferite limbi de nivel înalt într-o formă intermediară comună tuturor - nivelul de arhitectură a setului de instrucțiuni - și, în consecință, să construiască hardware care să poată executa direct programe la acest nivel Stratul de arhitectură a setului de instrucțiuni leagă compilatoare și hardware Este un limbaj pe care atât compilatorii, cât și dispozitivele îl înțeleg Pe fig Figura arată relația dintre compilatoare, nivelul arhitecturii setului de instrucțiuni și hardware Orez Stratul de arhitectură al setului de instrucțiuni este o legătură intermediară între compilatoare și hardware Capitolul Stratul de arhitectură al setului de instrucțiuni În mod ideal, atunci când construiesc o nouă mașină, arhitecții de instrucție ar trebui să se consulte atât cu compilatorul, cât și cu designerii hardware pentru a determina ce caracteristici ar trebui să aibă stratul lor Dacă dezvoltatorii compilatorului necesită o caracteristică pe care inginerii nu o pot implementa, atunci această idee nu va funcționa În același mod, dacă dezvoltatorii de hardware vor să introducă un element nou în computer, dar programatorii nu pot scrie programul pentru a-l susține, un astfel de proiect nu se va concretiza niciodată Nivelul de arhitectură rezultat al setului de instrucțiuni, optimizat pentru limbajele de programare dorite, este întotdeauna produsul multor discuții și modelări Dar toate acestea sunt în teorie Acum să trecem la realitatea dură Când apare o mașină nouă, prima întrebare pe care și-o pun toți potențialii cumpărători este: "Este mașina compatibilă cu versiunea inversă?" A doua întrebare este: "Pot rula vechiul sistem de operare pe el?" Și a treia întrebare: "Vor funcționa aplicațiile vechi pe această mașină și vor trebui înlocuite cu versiuni noi?" Dacă răspunsul la oricare dintre aceste întrebări este nu, dezvoltatorii trebuie să explice de ce Este puțin probabil ca clienții să vrea să-și arunce programele preferate pentru a începe de la capăt Acest fapt îi obligă pe producătorii de computere să mențină același nivel de instrucțiuni pe diferite modele sau cel puțin să-l facă compatibil cu invers Prin compatibilitate inversă, înțelegem capacitatea unei mașini noi de a rula programe vechi fără modificări În același timp, noua mașină poate accepta comenzi noi și poate avea alte caracteristici utilizate de noul software Dezvoltatorii trebuie să facă nivelul de comandă compatibil cu înapoi, dar sunt liberi să schimbe hardware-ul după bunul plac, deoarece aproape niciunuia dintre cumpărători îi pasă de ce sunt cu adevărat "interiorurile" computerului și ce anume face acest sau acel dispozitiv Dezvoltatorii pot trece de la firmware la utilizarea directă a dispozitivelor, pot adăuga conducte, pot implementa circuite superscalare și așa mai departe, dar cu condiția ca acestea să rămână compatibili cu nivelul de instrucțiuni al modelelor anterioare Scopul principal este să vă asigurați că programele vechi funcționează pe noua mașină Adică, sarcina iese în prim-plan nu doar de a crea mașini bune, ci de a crea mașini bune, cu condiția să fie compatibile cu invers Toate cele de mai sus nu scad de la importanța stratului de arhitectură a setului de instrucțiuni Nivelul de calitate al arhitecturii setului de instrucțiuni este extrem de important, mai ales în ceea ce privește capacitățile de calcul și costul Performanța mașinilor echivalente cu diferite niveluri de arhitectură a seturilor de instrucțiuni poate varia cu % Vrem doar să spunem că piața îngreunează într-o anumită măsură trecerea de la vechea arhitectură de echipă la cea nouă Cu toate acestea, uneori apar noi niveluri de instrucțiuni de uz general, iar pe piețele specializate (cum ar fi piața sistemelor încorporate sau piața procesoarelor multimedia), acestea apar mult mai frecvent Prin urmare, este important să înțelegeți cum funcționează acest nivel Prezentare generală a nivelului arhitecturii setului de instrucțiuni Ce este o arhitectură de comandă bună? Există doi factori principali În primul rând, o arhitectură bună ar trebui să ofere un set de comenzi care să poată fi implementate eficient nu numai în tehnologia modernă, ci și în tehnologia viitoare Cu o arhitectură de instrucțiuni prost proiectată, un procesor poate avea mai multe porți, programele pot necesita mai multă memorie pentru a rula și așa mai departe, un sistem cu o arhitectură de instrucțiuni și mai avansată poate În al doilea rând, o arhitectură de instrucțiuni bună ar trebui să ofere cea mai mare claritate despre exact ce ar trebui să fie programul compilat Regularitatea și completitudinea opțiunilor sunt caracteristici care nu sunt întotdeauna inerente arhitecturii echipelor Aceste trăsături sunt deosebit de importante pentru un compilator, care nu poate face întotdeauna cea mai bună alegere dintre mai multe alternative, mai ales dacă unele alternative aparent evidente nu sunt suportate de arhitectura de instrucțiuni Pe scurt, din moment ce stratul de arhitectură al setului de instrucțiuni este o legătură intermediară între hardware și software, ar trebui să fie acceptabil atât pentru dezvoltatorii hardware (în ceea ce privește implementarea eficientă), cât și pentru programatori (în ceea ce privește scrierea codului de calitate) Prezentare generală a nivelului arhitecturii setului de instrucțiuni Să începem studiul nostru asupra stratului arhitecturii setului de instrucțiuni întrebând ce este acesta Această întrebare poate părea simplă la prima vedere, dar de fapt există o mulțime de subtilități În următoarea subsecțiune, vom discuta unele dintre acestea și apoi ne vom uita la modelele de memorie, registru și instrucțiuni Set de instrucțiuni Proprietăți la nivel de arhitectură În principiu, nivelul arhitecturii setului de instrucțiuni este nivelul la care un computer este prezentat unui programator care scrie programe în limbajul mașinii Deoarece niciun programator normal nu scrie acum astfel de programe, am reelaborat ușor această definiție: un program la nivel de arhitectură de set de instrucțiuni este ceea ce rezultă din compilator (deocamdată ne vom ocupa de apelurile de sistem și limbajul de asamblare simbolic) Pentru a obține un program la nivel de arhitectură al setului de instrucțiuni, scriitorul compilatorului trebuie să știe ce model de memorie este utilizat în mașină, ce registre, tipuri de date și instrucțiuni sunt disponibile etc Toate aceste informații împreună determină nivelul arhitecturii setului de instrucțiuni În conformitate cu această definiție, întrebările despre dacă microarhitectura este accesibilă programatic, dacă computerul este pipeline, dacă este superscalar etc , nu aparțin nivelului de arhitectură al setului de instrucțiuni, deoarece Capitolul Stratul de arhitectură al setului de instrucțiuni dezvoltatorul compilatorului nu vede toate acestea Cu toate acestea, această remarcă nu este în întregime corectă, deoarece unele dintre aceste caracteristici afectează performanța, iar performanța, la rândul său, este un indicator care este destul de accesibil dezvoltatorului compilatorului Luați în considerare, de exemplu, o mașină superscalară care poate procesa instrucțiuni duble într-un ciclu, astfel încât o instrucțiune să fie întreagă, iar cealaltă să fie în virgulă mobilă Dacă instrucțiunile întregi și în virgulă mobilă sunt intercalate în codul rezultat din compilator, atunci performanța va crește considerabil Astfel, detaliile operației superscalare sunt disponibile la nivelul arhitecturii setului de instrucțiuni, adică granițele dintre diferitele niveluri sunt neclare Pentru unele arhitecturi, nivelul de instruire este definit printr-un document formal, de obicei emis de un consorțiu industrial, pentru altele nu este De exemplu, V SPARC (Versiunea SPARC) și sistemele JVM au definiții oficiale [ ] Scopul unei astfel de cărți albe este de a permite diferiților producători să producă mașini de acest tip, astfel încât aceste mașini să poată rula aceleași programe și să obțină aceleași rezultate În cazul sistemului SPARC, astfel de documente sunt necesare pentru ca întreprinderile diferite să poată produce cipuri SPARC identice care diferă unele de altele doar ca performanță și preț Pentru ca această idee să funcționeze, vânzătorii de cipuri trebuie să știe ce face un cip SPARC (la nivelul arhitecturii setului de instrucțiuni) Prin urmare, documentul vorbește despre ce este modelul de memorie, ce registre sunt, ce acțiuni efectuează instrucțiunile etc , și nu despre ce este microarhitectura Astfel de documente conțin secțiuni normative care stabilesc cerințele și secțiuni informative menite să ajute cititorul, dar nu fac parte din definiția formală În secțiunile normative se întâlnesc constant cuvinte care ar trebui, nu pot, ar trebui, adică o cerință, o interdicție și o recomandare De exemplu, următoarea propoziție înseamnă că, dacă un program execută un cod operațional care nu este definit, ar trebui să provoace o capcană, nu doar să fie ignorat: Executarea unui cod operațional rezervat trebuie să declanșeze o capcană Poate exista o abordare alternativă: Rezultatul executării unui cod operațional rezervat este definit de implementare Aceasta înseamnă că compilatorul compilatorului nu poate calcula nicio acțiune specifică, lăsând constructorilor liberi să aleagă Descrierile arhitecturii sunt adesea însoțite de pachete de testare pentru a verifica dacă implementarea îndeplinește de fapt specificația Este destul de clar de ce sistemul V SPARC vine cu un document care definește nivelul de arhitectură al setului de instrucțiuni - acest lucru este necesar pentru ca toate cipurile V SPARC să poată rula aceleași programe Prezentare generală a nivelului arhitecturii setului de instrucțiuni Noi Nu există un astfel de document pentru nivelul de arhitectură al setului de instrucțiuni al procesorului Pentium , deoarece Intel nu dorește ca alți producători să poată produce cipuri Pentium Intel a mers chiar în instanță pentru a interzice altor producători să-și producă cipurile, dar a pierdut proces O altă calitate importantă a stratului de arhitectură a setului de instrucțiuni este că majoritatea mașinilor acceptă cel puțin două moduri Sistemul de operare pornește în modul privilegiat Acest mod vă permite să executați toate comenzile Modul utilizator este destinat lansării de programe de aplicație Împiedică executarea unor comenzi potențial periculoase (de exemplu, cele care manipulează direct memoria cache) În acest capitol, ne vom concentra în primul rând pe comenzile și proprietățile modului utilizator Modele de memorie În toate computerele, memoria este împărțită în celule care au adrese secvențiale În prezent, cea mai comună dimensiune a celulei este de biți, dar în trecut erau folosite celule de la la de biți (vezi Tabelul ) O celulă de biți se numește octet Motivul pentru utilizarea celulelor de memorie de biți este caracterul ASCII, care ocupă biți, și împreună cu bitul de paritate - Dacă codarea UNICODE domină în viitor, atunci celulele de memorie pot deveni pe biți În general, este mai bun decât deoarece este o putere a lui și nu este Octeții sunt de obicei grupați în cuvinte de octeți ( de biți) sau de octeți ( de biți) cu instrucțiuni de manipulare a cuvintelor întregi Multe arhitecturi necesită ca cuvintele să fie aliniate în limitele lor naturale Astfel, un cuvânt de octeți poate începe la adresa , , etc , dar nu la adresa sau În mod similar, un cuvânt de octeți poate începe la adresa , sau , dar nu la adresa sau Mecanismul de alocare a cuvintelor de octeți în memorie este ilustrat în fig Alinierea adreselor este necesară destul de des, deoarece este cea mai eficientă modalitate de utilizare a memoriei De exemplu, procesorul Pentium , care accesează octeți de memorie per acces, folosește adrese fizice de de biți, dar conține doar de biți de adresă Prin urmare, Pentium nici măcar nu va putea accesa memoria nealiniată, deoarece cei biți inferiori nu sunt definiți în mod explicit Acești biți sunt întotdeauna și toate adresele de memorie sunt multipli de octeți Cu toate acestea, cerința pentru alinierea adresei cauzează uneori unele probleme Pe procesorul Pentium , programele pot accesa cuvinte începând de la orice adresă, o calitate care se întoarce la cu o magistrală de date de octet care nu necesita ca celulele să se afle pe granițele de octeți Dacă un program din procesorul Pentium citește un cuvânt de octeți de la adresa , hardware-ul trebuie să facă un acces de memorie pentru a apela octeții de la la și un al doilea pentru a apela octeții de la la CPU-ul preia apoi cei octeți necesari din Capitolul Stratul de arhitectură al setului de instrucțiuni citește din memorie și le aranjează în ordinea corectă pentru a forma un cuvânt de octeți A Cuvânt aliniat de octeți la adresa celulei Abordare octeți ! și ta s yy yii! Nealiniat de octeți DESPRE cuvânt în celulă cu adresa b Orez Locația cuvântului de octeți în memorie: cuvânt(e) aliniat(e); cuvânt nealiniat (b) Unele mașini necesită ca cuvintele să fie aliniate în memorie Capacitatea de a citi cuvinte cu adrese arbitrare necesită complexitatea cipului, care devine apoi mai mare și mai scump Dezvoltatorii ar fi bucuroși să scape de un astfel de cip și ar cere pur și simplu ca toate programele să acceseze memoria cuvânt cu cuvânt, nu octet cu octet Cu toate acestea, la întrebarea tradițională a dezvoltatorilor: "Cine are nevoie de programe vechi scrise pentru mașini și complet greșit cu memoria?" - urmează răspunsul nu mai puțin tradițional al vânzătorilor: "Către cumpărătorii noștri" Majoritatea mașinilor au un singur spațiu de adrese liniar care merge de la adresa la un maxim, de obicei sau de octeți Unele mașini au spații de adrese separate pentru instrucțiuni și date, astfel încât un apel de instrucțiuni la adresa și un apel de date la adresa se referă la spații de adrese diferite Un astfel de sistem este mult mai complex decât un singur spațiu de adrese, dar are două avantaje În primul rând, cu aceleași adrese de de biți, devine posibil să aveți de octeți pentru programe și de octeți suplimentari pentru date În al doilea rând, deoarece scrierea are loc întotdeauna automat numai în spațiul de date, suprascrierea accidentală a programului devine imposibilă și, prin urmare, una dintre sursele erorilor de program este eliminată Rețineți că spațiile separate pentru instrucțiuni și adrese de date nu sunt aceleași cu un cache L partajat În primul caz Prezentare generală a nivelului arhitecturii setului de instrucțiuni întregul spațiu de adrese este duplicat, iar citirea de la orice adresă produce rezultate diferite, în funcție de faptul că este un cuvânt de date sau o comandă citită Cu un cache divizat, există un singur spațiu de adrese, doar că diferite părți ale acestui spațiu sunt stocate în diferite blocuri cache Un alt aspect al modelului memoriei este semantica memoriei Este firesc să ne așteptăm ca instrucțiunea LOAD, dacă este executată după instrucțiunea STORE, să se refere la aceeași adresă și să returneze valoarea doar stocată Totuși, așa cum am văzut în Capitolul , microinstrucțiunile sunt reordonate pe multe mașini Astfel, există un pericol real ca memoria să nu funcționeze conform așteptărilor Situația devine mai complicată în prezența unui multiprocesor, când fiecare procesor trimite un flux de cereri de citire și scriere în memoria partajată, iar aceste solicitări pot fi și reordonate Dezvoltatorii de sisteme pot adopta una dintre mai multe abordări pentru a rezolva această problemă Pe de o parte, toate cererile de memorie pot fi ordonate în așa fel încât fiecare să fie finalizată înainte de a începe următoarea O astfel de strategie are un efect negativ asupra performanței, dar oferă cea mai simplă semantică a memoriei (toate operațiunile sunt efectuate strict în ordinea în care sunt localizate în program) Pe de altă parte, nu puteți face deloc garanții cu privire la ordonarea solicitărilor de memorie, iar pentru a realiza această ordonare, programul emite o comandă SYNC, care blochează începerea tuturor operațiunilor noi de memorie până la finalizarea celor anterioare Această idee îl face foarte dificil pentru dezvoltatorii de compilatoare, deoarece trebuie să înțeleagă cu atenție cum funcționează microarhitectura corespunzătoare, dar designerilor de hardware li se oferă libertate deplină în ceea ce privește optimizarea utilizării memoriei De asemenea, sunt posibile modele de memorie intermediară, în care hardware-ul blochează automat anumite operațiuni de memorie (cum ar fi cele asociate cu dependențele RAW și WAR) de la pornire, în timp ce nu blochează pornirea tuturor celorlalte operațiuni Deși implementarea acestor caracteristici la nivelul arhitecturii setului de instrucțiuni este destul de plictisitoare (cel puțin pentru scriitorii de compilatori și programatorii de limbaje de asamblare), există acum o tendință notabilă către prevalența acestei abordări Această tendință este determinată de evoluții precum mecanismele de reordonare a microinstrucțiunilor, conductele, cache-urile pe mai multe niveluri și așa mai departe Alte exemple mai puțin cunoscute de acest gen vor fi discutate mai târziu în acest capitol Registrele Toate computerele au mai multe registre disponibile la nivelul arhitecturii setului de instrucțiuni Acestea vă permit să controlați execuția programului, să stocați rezultate temporare și să servească și pentru alte scopuri În general, registrele disponibile la nivel de microarhitectură, cum ar fi TOS și MAR (vezi Figura ), nu sunt disponibile la nivelul arhitecturii setului de instrucțiuni, dar unele registre, cum ar fi contorul de program și pointerul stivei, sunt disponibile la nivelul setului de instrucțiuni Capitolul Stratul de arhitectură al setului de instrucțiuni ambele niveluri În același timp, registrele disponibile la nivelul arhitecturii setului de instrucțiuni sunt întotdeauna disponibile la nivel de microarhitectură, deoarece acolo sunt implementate Registrele de nivel de arhitectură setului de instrucțiuni pot fi împărțite în două categorii: registre speciale și registre de uz general Registrele speciale includ contorul de programe și indicatorul de stivă, precum și alte registre care au funcții speciale Registrele de uz general conțin variabile locale cheie și rezultate intermediare ale calculelor Funcția lor principală este de a oferi acces rapid la datele utilizate frecvent (de obicei fără acces la memorie) Mașinile RISC cu procesoare de mare viteză și memorie (relativ) lentă conțin de obicei cel puțin de registre de uz general, numărul de registre de uz general crescând constant la procesoare noi În unele mașini, registrele de uz general sunt complet simetrice și interschimbabile Dacă toate registrele sunt echivalente, compilatorul poate folosi atât registrul R , cât și registrul R pentru a stoca rezultatul intermediar Alegerea registrului nu contează Pe alte mașini, unele registre de uz general pot fi specializate De exemplu, procesorul Pentium are un registru EDX care poate fi folosit ca registru de uz general, dar care este folosit și pentru rezolvarea unor sarcini foarte specifice (obține jumătate din produs la înmulțire și jumătate din dividend la împărțire) Chiar dacă registrele de uz general sunt complet interschimbabile, sistemul de operare sau compilatoarele respectă adesea convențiile cu privire la modul de utilizare a acestor registre De exemplu, unele registre ar putea fi folosite pentru a stoca parametrii procedurilor apelate, în timp ce altele ar putea fi folosite ca registre temporare Dacă compilatorul plasează o variabilă locală importantă în registrul R și apoi apelează o procedură de bibliotecă care tratează R ca pe un registru alocat temporar acestuia, gunoiul poate fi lăsat în registrul R după ce procedura returnează o valoare Adică, dacă există convenții de sistem privind modul în care ar trebui să fie utilizate registrele, scriitorii de compilatori și programatorii de asamblare trebuie să le respecte Pe lângă registrele disponibile la nivelul arhitecturii setului de instrucțiuni, există întotdeauna destul de puține registre speciale disponibile doar în modul privilegiat Aceste registre controlează diverse blocuri cache, memoria principală, dispozitivele I/O și alte dispozitive ale mașinii Aceste registre sunt utilizate numai de sistemul de operare, astfel încât compilatorii și utilizatorii nu trebuie să fie conștienți de existența lor Există un registru care este un "hibrid" care este disponibil atât în modul privilegiat, cât și în modul utilizator Acesta este registrul PSW (Program State Word) menționat în capitolul , care se mai numește și registrul flag Registrul flag conține diferiți biți necesari CPU Cei mai importanți biți sunt codurile de stare Ele sunt setate în fiecare ciclu ALU și reflectă starea rezultatului operației anterioare: Prezentare generală a nivelului arhitecturii setului de instrucțiuni ♦ N - rezultatul este negativ (Negativ); ♦ Z - rezultatul este (Zero); ♦ V - rezultatul a provocat un overflow (oVerflow); ♦ С - transferul bitului din stânga (Capu out); ♦ A - bit carry (Auxiliary carry - service carry); ♦ R - rezultatul este par (Paritate) Codurile de condiție sunt foarte importante deoarece sunt folosite în comparații și salturi condiționate De exemplu, instrucțiunea CMP scade de obicei un operand din altul și setează codurile de condiție pe baza diferenței Dacă operanzii sunt egali, diferența va fi și bitul Z va fi setat în registrul flag Instrucțiunea ulterioară BEQ (Branch Equal) verifică bitul Z și sare dacă este setat Registrul de steag poate stoca mai mult decât coduri de stare Conținutul acestuia poate varia de la o mașină la alta Câmpurile suplimentare indică modul mașinii (de exemplu, utilizator sau privilegiat), bit de urmărire (care este utilizat pentru depanare), nivelul de prioritate a procesorului, starea de activare a întreruperii Registrul steag este de obicei citit în modul utilizator, dar unele câmpuri pot fi scrise doar în modul privilegiat (de exemplu, bitul care specifică modul) Echipe Principala caracteristică a nivelului pe care îl luăm în considerare acum este un set de instrucțiuni ale mașinii Ei controlează acțiunile mașinii În acest set, există întotdeauna într-o formă sau alta comenzile LOAD și STORE menite să mute date între memorie și registre și comanda MOVE, care servește la copierea datelor dintr-un registru în altul De asemenea, există întotdeauna comenzi aritmetice și logice, comenzi pentru compararea elementelor de date și comenzi de salt în funcție de rezultate Câteva comenzi tipice au fost deja discutate în Capitolul (vezi Tabelul ), iar în acest capitol vom fi prezentate multe altele În acest capitol, vom discuta trei arhitecturi de instrucțiuni foarte diferite: Intel IA- (găsit în Pentium ), versiunea SPARC (găsită în procesoarele UltraSPARC) și Nu este intenția noastră să oferim o descriere exhaustivă a fiecare dintre aceste arhitecturi Vrem doar să demonstrăm aspecte importante ale arhitecturii de comandă și să arătăm cum se schimbă aceste aspecte de la o arhitectură la alta Să începem cu aparatul Pentium Prezentare generală a nivelului arhitecturii setului de instrucțiuni Pentium Procesorul Pentium a evoluat de-a lungul anilor După cum s-a menționat în Capitolul , istoria sa merge înapoi la cele mai vechi microprocesoare Arhitectura de bază a instrucțiunilor permite executarea programelor scrise pentru Capitolul Stratul de arhitectură al setului de instrucțiuni Procesoare și (care au aceeași arhitectură de instrucțiuni) și parțial chiar și pentru , un procesor pe biți care a fost popular în anii , la rândul său, a fost puternic influențat de cerințele de compatibilitate cu procesorul , care se baza pe procesorul (un cip pe biți datând din epoca de piatră) Din punct de vedere software, computerele și erau pe biți (deși computerul conținea o magistrală de date pe biți) Succesorul lor, , era, de asemenea, pe biți Principalul său avantaj a fost un spațiu de adrese mai mare, deși foarte puține programe l-au folosit pentru că era format din de segmente de de kiloocteți, mai degrabă decât din memorie liniară de de octeți Procesorul a fost prima mașină pe de biți lansată de Intel Toate procesoarele ulterioare ( , Pentium, Pentium Pro, Pentium II, Pentium III, Pentium , Celeron, Cheop, Pentium M, Centrino etc ) au exact aceeași arhitectură pe de biți numită IA- , așa că ne vom concentra atenție asupra acestei arhitecturi Singura schimbare semnificativă de arhitectură de la a fost introducerea instrucțiunilor MMX în versiunile ulterioare ale Pentium Aceste comenzi îndeplinesc o funcție foarte specifică - îmbunătățesc performanța aplicațiilor multimedia Pentium are moduri de operare, din care două se comportă ca un În modul real, toate caracteristicile cu care a fost dotat procesorul de la sunt dezactivate, iar Pentium funcționează ca un simplu procesor A eroarea software provoacă o defecțiune completă a sistemului Dacă Intel ar dezvolta ființe umane, atunci cu siguranță s-ar pune un pic special în interiorul fiecărei astfel de creaturi, readucerea unei persoane la modul de funcționare al strămoșilor săi (creier primitiv, lipsă de vorbire, viață în copaci, o dietă pur cu banane etc ) Următorul pas este modul procesor virtual , care face posibilă rularea programelor vechi scrise pentru , dar cu protecție Pentru a rula vechiul program , sistemul de operare creează un mediu izolat special care acționează ca procesorul , cu excepția faptului că, atunci când are loc o defecțiune a software-ului, informațiile corespunzătoare sunt transferate sistemului de operare, iar sistemul nu se blochează complet Când un utilizator de Windows deschide o fereastră MS-DOS, programul care rulează în acea fereastră rulează în modul procesor virtual , ceea ce ajută la protejarea Windows de posibilele libertăți ale programelor DOS Ultimul mod este modul protejat, în care Pentium se comportă ca un Pentium , nu ca un În acest mod, sunt disponibile niveluri de privilegii, setate de biți în registrul flag (PSW) Nivelul corespunde modului privilegiat pe alte computere și oferă acces complet la mașină Acest nivel este utilizat de sistemul de operare Nivelul este pentru programele utilizatorului La acest nivel, accesul la anumite comenzi și registre de control este blocat, astfel încât eșecul unui program utilizator să nu conducă la prăbușirea întregului sistem Nivelurile și sunt rar utilizate Prezentare generală a nivelului arhitecturii setului de instrucțiuni Pentium are un spațiu de adrese uriaș Memoria este împărțită în de segmente, fiecare ocupând adrese de la la - Cu toate acestea, majoritatea sistemelor de operare (inclusiv UNIX și toate versiunile de Windows) acceptă doar un singur segment, astfel încât un spațiu de adrese liniar de de octeți este de obicei disponibil pentru programele de aplicație , uneori o parte din acest spațiu este ocupată de sistemul de operare în sine Fiecare octet din spațiul de adrese are propria sa adresă Cuvintele au de biți Octeții sunt numerotați de la dreapta la stânga (adică prima adresă corespunde octetului cel mai puțin semnificativ) Registrele procesorului Pentium sunt prezentate în fig Primele patru registre, EAX, EBX, ECX și EDX, sunt pe de biți Acestea sunt registre de uz general, deși fiecare dintre ele are anumite caracteristici EAX - registru aritmetic de bază; EBX este conceput pentru a stoca pointeri (adrese de memorie); ECX este despre ciclism; EDX este necesar pentru înmulțire și împărțire - acest registru, împreună cu EAX, conține produse și dividende pe de biți EIR steaguri Orez Principalele registre ale procesorului Pentium Capitolul Stratul de arhitectură al setului de instrucțiuni Cei și biți inferiori din fiecare dintre registrele considerate sunt registre independente de și, respectiv, biți, permițându-vă să manipulați cu ușurință valorile de și biți În calculatoarele și există doar registre de și biți, registrele de de biți au apărut în sistemul împreună cu prefixul E (Extended - extins) Următoarele trei registre sunt și registre de uz general, dar cu un grad mai mare de specializare Registrele ESI și EDI sunt concepute pentru a stoca pointeri și sunt concentrate în principal pe suport hardware pentru comenzile șir: ESI indică șirul sursă, EDI către șirul țintă Registrul EVR este, de asemenea, proiectat pentru a stoca pointeri și este de obicei folosit pentru a indica baza cadrului variabil local curent, la fel ca registrul LV din mașina IJVM Un astfel de registru este denumit în mod obișnuit indicator de cadru În cele din urmă, registrul ESP este indicatorul stivei Următorul grup de registre de la CS la GS sunt registre de segment Acestea sunt trilobiți electronici - atavisme rămase de la procesorul , care avea de octeți de memorie disponibili prin adrese pe biți Este suficient să spunem că atunci când Pentium rulează în modul de spațiu de adresă liniar unic de de biți, acestea pot fi ignorate în siguranță Registrul EIP (Extended Instruction Pointer) este un contor de program Registrul EFLAGS este un registru steag Prezentare generală a nivelului arhitecturii setului de instrucțiuni UltraSPARC III Arhitectura SPARC a fost introdusă pentru prima dată în de Sun Micro-systems Această arhitectură a devenit una dintre primele arhitecturi industriale RISC Sa bazat pe un studiu efectuat la Berkeley în anii [ , ] Arhitectura SPARC a fost inițial pe de biți, dar UltraSPARC III este o mașină pe de biți bazată pe arhitectura SPARC Versiunea și asta vom descrie în acest capitol Pentru coerență cu restul acestei cărți, ne vom referi la acest sistem ca UltraSPARC III, deși la nivelul arhitecturii setului de instrucțiuni, toate mașinile UltraSPARC sunt identice Structura de memorie a mașinii UltraSPARC III este foarte simplă - o matrice liniară de de octeți În prezent, nu este posibilă implementarea deoarece memoria este prea mare ( octeți) Implementările actuale au o limită a dimensiunii spațiului de adrese pe care îl pot accesa ( de octeți pentru UltraSPARC III), dar acest număr va crește în viitor Octeții sunt numerotați de la stânga la dreapta, dar puteți comuta la numerotarea de la dreapta la stânga setând unul dintre biții din registrul de steag Este important ca limita de octeți adresabili să fie mai mare decât ceea ce este necesar pentru implementarea arhitecturii de instrucțiuni, deoarece în viitor este probabil ca cantitatea de memorie care poate fi accesată de procesor va trebui să fie mărită Una dintre cele mai mari probleme este că arhitectura de instrucțiuni limitează dimensiunea memoriei adresabile Aceasta este o manifestare a unei probleme globale de informare (nu sunt întotdeauna destui biți disponibili), care probabil nu va fi rezolvată Prezentare generală a nivelului arhitecturii setului de instrucțiuni nu Într-o zi, nepoții noștri se vor întreba cum ar putea funcționa computerele cu adrese de doar de biți și GB de memorie Arhitectura de instrucțiuni SPARC este destul de simplă, deși organizarea registrului a fost ușor complicată pentru a face apelurile de procedură mai eficiente Practica arată că organizarea registrelor necesită mult efort și, deși acest efort de obicei nu merită, regula de compatibilitate nu vă permite să-l refuzați Sistemul UltraSPARC III are două grupuri de registre: de registre de uz general pe de biți și de registre în virgulă mobilă Registrele de uz general se numesc R -R , dar alte denumiri sunt folosite în anumite contexte Variantele denumirilor registrelor și funcțiile acestora sunt date în tabel Tabelul - -Registre de uz general UltraSPARC III Înregistrare Nume alternativ Scop R G Hardware zero Ceea ce este stocat în acest registru este pur și simplu ignorat R -R G -G Conțin variabile globale R -R - Conține parametrii procedurii apelate R SP Stack Pointer R Registrul temporar R -R L -L Conține variabile locale pentru procedura curentă R -R I -I Conțin parametrii de intrare R FP Indicator la baza cadrului stivei curente R I Conține adresa de retur pentru procedura curentă Toate registrele de uz general sunt pe de biți Toate acestea, cu excepția R , care este întotdeauna zero, pot fi citite și scrise folosind diverse comenzi de încărcare și stocare Scopul acestor registre, prezentat în tabel , parțial determinat prin convenție, parțial dependent de hardware-ul utilizat În general, totuși, nu ar trebui să vă abateți de la această misiune decât dacă sunteți un expert în calculatoarele SPARC Programatorul trebuie să se asigure că programul accesează corect registrele și efectuează operații aritmetice valide cu acestea De exemplu, este foarte ușor să încărcați numere în virgulă mobilă în registre de uz general și apoi să efectuați adunarea întregilor asupra lor, operație care va avea ca rezultat o prostie completă, dar pe care CPU-ul o va face cu siguranță dacă programul o cere Variabilele globale sunt folosite pentru a stoca constante, variabile și pointeri care sunt necesare în toate procedurile, deși pot fi încărcate și reîncărcate după cum este necesar la intrarea și ieșirea din procedură Registrele Ix și Ox sunt folosite pentru a transmite parametri la proceduri pentru a evita accesul la memorie În continuare, vom descrie cum se întâmplă acest lucru Capitolul Stratul de arhitectură al setului de instrucțiuni Registrele speciale sunt folosite în scopuri speciale Registrele FP și SP limitează cadrul curent Primul indică la baza cadrului curent și este folosit pentru a accesa variabilele locale, la fel ca LV din Fig Al doilea indică spre partea de sus a stivei și se schimbă atunci când cuvintele sunt împinse sau scoase din stivă Valoarea registrului FP este modificată numai atunci când procedura este apelată și terminată Al treilea registru special este R Conține adresa de retur pentru procedura curentă R R R R R R R R R R R R R G , ' R ,G Registrul global Registrul global G R Registrul global G R R R SP Stack Pointer Redenumirea R Registrul provizoriu R |Y| Registrul local CWP= R L Registrul local RO Parametru de ieșire R IO Parametru de intrare OS Out Parametru SP Stack Pointer Suprapunere R R I , FP, Input Parameter Frame Pointer , Registrul temporar R І Adresa expeditorului L Registrul local O parte din fereastra anterioară CWP L , Registrul local ' n) merge la L ; primul operator; ultimul operator; = + ; dus la LI; L : Luați în considerare codul pe care compilatorul îl va genera atunci când procesează următoarea linie: pentru ( = ; (verificând, de exemplu, ce valoare este atribuită lui n), poate folosi codul mai eficient prezentat în Listarea Standardul limbajului FORTRAN a cerut odată ca toate buclele să fie executate cel puțin o dată Acest lucru ne-a permis să generăm întotdeauna cod mai eficient (ca în Listarea ) În , acest defect a fost corectat, deoarece până și adepții FORTRAN au început să realizeze că nu era foarte bine să existe o declarație de buclă cu o semantică atât de ciudată, deși salvează o instrucțiune de salt pe buclă Comenzi I/O Niciun alt grup de instrucțiuni nu variază în funcție de mașină la fel de mult ca instrucțiunile I/O Calculatoarele personale moderne folosesc trei scheme I/O diferite: ♦ I/O programabil cu așteptare activă; ♦ I/O cu control întrerupere; ♦ I/O cu acces direct la memorie Vom analiza pe rând fiecare dintre aceste scheme Cea mai simplă metodă I/O este I/O programabilă Această schemă este adesea folosită în microprocesoarele cu costuri reduse, cum ar fi sistemele încorporate sau sistemele care trebuie să răspundă rapid la schimbările externe (sisteme în timp real) Astfel de procesoare au de obicei o instrucțiune de intrare și o instrucțiune de ieșire Fiecare dintre aceste comenzi selectează unul dintre dispozitivele I/O Un caracter este transferat între un registru de procesor fix și dispozitivul I/O selectat Procesorul trebuie să execute o anumită secvență de instrucțiuni de fiecare dată când citește și scrie un caracter Ca exemplu, luați în considerare un terminal cu patru registre de octet, așa cum se arată în Fig Pentru introducere sunt utilizate două registre: registrul de stare a dispozitivului și registrul de date Pentru ieșire sunt utilizate două registre: Capitolul Stratul de arhitectură al setului de instrucțiuni de asemenea, un registru de stare a dispozitivului și un registru de date Fiecare dintre ele are o adresă unică Dacă există I/O mapate în memorie, toate cele registre fac parte din spațiul de adrese și pot fi citite și scrise folosind instrucțiunile normale de memorie În caz contrar, citirea și scrierea registrelor necesită instrucțiuni speciale I/O, cum ar fi IN și OUT În ambele cazuri, I/O se realizează prin transferul de date și informații despre starea dispozitivului între CPU și registrele specificate Bit de prezență a caracterului tampon Gata să primească următorul bit de caracter Stare tastatură / Afișează starea Activați întreruperile Activați întreruperile Buffer de tastatură Simbol primit Afișare buffer Caracter de afișat Orez Dispozitivul se înregistrează într-un terminal simplu Sunt utilizați doar din cei biți din registrul de stare a tastaturii Bitul din stânga este setat de hardware ori de câte ori apare un caracter în buffer-ul tastaturii Dacă bitul a fost setat anterior de software, se execută o întrerupere În caz contrar, nu apare nicio întrerupere În I/O programabile, pentru a primi date de intrare, CPU citește de obicei registrul de stare a tastaturii periodic într-o buclă până când bitul este setat la Când se întâmplă acest lucru, registrul tampon al tastaturii este citit programatic pentru a obține un caracter Citirea registrului de date face ca bitul de caracter prezent să fie șters Concluzia se face într-un mod similar Pentru a afișa un caracter pe ecran, registrul de stare de afișare este mai întâi citit de software pentru a vedea dacă bitul de pregătire este setat Dacă nu este setat, bucla este executată din nou și din nou până când bitul gata devine unul Aceasta va indica faptul că dispozitivul este pregătit să accepte caracterul Odată ce terminalul este în starea de pregătire, caracterul este scris în registrul tampon al afișajului în software, care afișează caracterul pe ecran și indică dispozitivului să resetați bitul pregătit în registrul de stare a afișajului Când un caracter apare pe ecran și terminalul se pregătește să proceseze următorul caracter, controlerul setează din nou bitul gata Ca exemplu de I/O programabil, luați în considerare procedura Java (Listarea ) Această procedură este apelată cu doi parametri: o matrice de caractere de tipărit și numărul de caractere din matrice (până la un kilobit) Corpul procedurii este o buclă care scoate câte un caracter la un moment dat În primul rând, procesorul central așteaptă ca dispozitivul să fie gata și numai după aceea scoate un caracter și această secvență de acțiuni Tipuri de comenzi Acțiunea se repetă pentru fiecare personaj Rutinele ip și out sunt rutine tipice de asamblare pentru citirea și scrierea registrelor dispozitivului, care sunt definite de primul parametru Variabila din care să citiți sau să scrieți este determinată de al doilea parametru Împărțirea la (prin deplasarea la dreapta cu biți) elimină cei biți inferiori, lăsând bitul gata la bitul zero Lista Exemplu I/O programabil public static vold output buffer( nt buf[], număr int) { // Ieșire bloc de date către dispozitiv stare int, gata; pentru ( = ; la SP -> k= Valoare FP veche = Valoare FP veche = Adresa de retur Adresa de retur j= j= I= i= FP n= FP n= SP ► la k= k= k= Adresă de returnare FP valoare veche = FP valoare veche = FP valoare veche = Valoare veche FP = Adresa de retur Adresa de retur Adresa de retur j= І= j= j= І= І= i= i= FP -> n= n= n= n= SP-K k k = k = k = k = Valoare FP veche Valoare FP veche Valoare FP veche Valoare FP veche Valoare FP veche Adresa de retur Adresa de retur Adresa de retur Adresa de retur Adresa de retur j= i= j= j= j= І= І= І= i= i= FP -► n= n= > n= ► n= > n= A b c d Orez Starea stivei în timpul execuției programului din lista Capitolul Stratul de arhitectură al setului de instrucțiuni Primul lucru pe care ar trebui să-l facă procedura după apel este să salveze valoarea anterioară a FP (astfel încât să poată fi restabilită atunci când procedura iese), să copieze valoarea lui SP în FP și, eventual, să mărească SP cu un cuvânt, în funcție de locul în care se află punctele FP ale noului cadru În acest exemplu, FP indică către prima variabilă locală (deși în IJVM registrul LV a indicat indicatorul de legătură) Diferite mașini manipulează indicatorul de cadru ușor diferit, uneori plasându-l chiar în partea de jos a cadrului stivei, alteori în partea de sus și alteori la mijloc, ca în Fig În acest sens, merită să comparăm Fig cu fig pentru două moduri diferite de a trata un pointer de legătură Alte moduri sunt posibile Dar, în orice caz, trebuie să fie posibilă ieșirea din procedură și restabilirea stării anterioare a stivei Codul care păstrează vechiul indicator de cadru, setează noul indicator de cadru și incrementează indicatorul de stivă pentru a rezerva spațiu pentru variabilele locale se numește prolog de procedură La ieșirea din procedură, stiva trebuie golită, iar această sarcină este rezolvată în epilogul procedurii Una dintre cele mai importante caracteristici ale unui computer este cât de repede poate rula prologul și epilogul Daca sunt foarte lungi si ruleaza incet, nu este profitabil sa apelezi la proceduri Comenzile ENTER și LEAVE din Pentium au fost concepute special pentru a face ca prologurile și epilogurile procedurilor să funcționeze eficient Desigur, ele acceptă un anumit model de gestionare a indicatorului de cadru, iar dacă compilatorul acceptă un alt model, aceste comenzi nu pot fi utilizate Acum înapoi la Turnul din Hanoi Fiecare apel de procedură adaugă un nou cadru la stivă, iar fiecare ieșire de procedură elimină un cadru din stivă Să vedem cum se folosește stiva la implementarea procedurilor recursive și să începem prin a apela turnuri ( , , ) Pe fig a arată starea stivei imediat după apelul procedurii În primul rând, procedura verifică dacă n este egal cu unu și, după ce se stabilește că n = , completează k și efectuează un apel turnuri ( , , ) Starea stivei după finalizarea acestui apel este prezentată în Fig b Apoi procedura este executată din nou (procedura apelată începe întotdeauna de la început) De data aceasta condiția n = eșuează din nou, așa că procedura completează din nou k și apelează turnuri ( , , ) Starea stivei după acest apel este prezentată în Fig , c Contorul programului indică începutul procedurii De data aceasta, condiția este adevărată și pe ecran este afișat un șir Apoi se iese din procedura Pentru a face acest lucru, un cadru este șters și valorile FP și SP sunt redefinite (Fig , d) Procedura continuă de la adresa de retur: turnuri ( , , ) Acest apel împinge un nou cadru pe stivă (Figura , ) Se imprimă o altă linie După încheierea procedurii, cadrul este scos din stivă Apeluri de procedură Controlul fluxului continuă până la finalizarea execuției primei proceduri și până la cadrul prezentat în Fig , de asemenea, nu va fi scos din stivă Pentru a înțelege mai bine cum funcționează recursiunea, este necesar, folosind doar un pix și hârtie, să reproducem complet execuția procedurii turnuri ( ) Coroutine Într-o secvență normală de apel, există o diferență evidentă între procedura de apelare și procedura apelată Luați în considerare procedura A, care numește procedura B (Figura ) Apelant Callee Orez Executarea unei proceduri apelate începe întotdeauna de la începutul acesteia Capitolul Stratul de arhitectură al setului de instrucțiuni Procedura B rulează o perioadă, apoi revine la A La prima vedere, aceste situații pot părea simetrice, deoarece nici A, nici B nu sunt programe principale - sunt proceduri (deși procedura A ar putea fi numită program principal dacă se dorește, în acest caz este gresit) Mai mult, controlul este mai întâi transferat de la A la B (la apel), apoi de la B la A (la întoarcere) Diferența este că atunci când controlul trece de la A la B, procedura B începe de la început; iar când controlul este transferat de la B înapoi la A, execuția procedurii A nu continuă de la început, ci din momentul urmat de apelarea la procedura B Dacă A rulează o perioadă, apoi apelează din nou procedura B, execuția din B începe din nou de la început, nu din punctul în care controlul a fost returnat la procedura A Dacă procedura A apelează procedura B de multe ori, procedura B începe de la început de fiecare dată, iar procedura A nu începe niciodată de la început Această diferență se reflectă în modul în care controlul este transferat între A și B Când procedura A îl apelează pe B, folosește o instrucțiune de apel de procedură care plasează adresa de retur (adică adresa instrucțiunii care urmează procedura din program) în un loc unde va fi apoi va fi ușor de extras, de exemplu, în partea de sus a stivei Apoi introduce adresa procedurii B în contorul de programe pentru a finaliza apelul Pentru a ieși din procedura B, instrucțiunea de apel de procedură nu este folosită, ci instrucțiunea de ieșire a procedurii, care pur și simplu scoate adresa de retur din stivă și o pune în contorul de programe Cu toate acestea, uneori doriți ca ambele proceduri (A și B) să se apeleze reciproc ca procedură, așa cum se arată în Figura La întoarcerea de la B la A, procedura B sare la instrucțiunea precedată de apelul la procedura B Când procedura A transferă controlul către procedura B, aceasta nu revine chiar la începutul lui B (cu excepția primei oară), ci la loc înaintea căruia a avut loc un apel anterior către A Două proceduri care funcționează în acest fel se numesc coroutine Coroutinele sunt de obicei folosite pentru procesarea paralelă a datelor pe un singur procesor Fiecare corutine functioneaza parca simultan cu alte corutine, ca si cum ar avea propriul procesor Această abordare simplifică programarea unor aplicații De asemenea, este util pentru testarea software-ului conceput pentru multiprocesor Comenzile obișnuite CALL și RETURN nu sunt potrivite pentru apelarea corutinelor, deoarece, deși adresa de salt este luată din stivă, ca și în cazul controlului de retur, dar spre deosebire de controlul de retur, la apelarea unei corutine, adresa de retur este plasată într-un anumit loc în ordine pentru a reveni la el mai târziu Ar fi bine dacă ar exista o instrucțiune care să folosească un contor de program în loc de partea de sus a stivei Această instrucțiune trebuie să scoată mai întâi vechea adresă de retur de pe stivă și să o împingă într-un registru intern, apoi să împingă contorul de program pe stivă și, în sfârșit, să copieze conținutul registrului intern în contorul de programe Deoarece un cuvânt este scos din stivă și altul este împins pe stivă, starea indicatorului de stivă nu se schimbă O astfel de comandă este foarte rară, așa că în majoritatea cazurilor trebuie modelată din mai multe comenzi Controlul fluxului Procedura A este apelată din programul principal Procedura A readuce controlul programului principal a b Orez După terminarea corutinei, execuția începe de unde a rămas ultima dată, nu de la început Prinderea de excepții Captarea excepțiilor este un tip special de apel de procedură care are loc în anumite condiții, de obicei foarte grave, dar rare Un exemplu de astfel de condiție este preaplinul Pe majoritatea procesoarelor, dacă rezultatul unei operații aritmetice depășește cel mai mare număr permis, apare o excepție și este prinsă Aceasta înseamnă că fluxul de control merge într-o locație fixă de memorie și nu continuă secvenţial mai departe Această celulă fixă conține o comandă pentru a trece la o procedură specială (manager de excepții) care efectuează o anumită acțiune, cum ar fi imprimarea unui mesaj de eroare Dacă rezultatul operației este în intervalul permis, nu apare nicio excepție Important este că excepțiile pot fi aruncate în software și sunt prinse în hardware sau la nivel de firmware Pe lângă identificarea unei excepții, există o altă modalitate de a determina dacă a avut loc o depășire Pentru a face acest lucru, trebuie să aveți un registru de bit care va fi setat ori de câte ori are loc o depășire În acest caz, programatorul care ar dori Capitolul Stratul de arhitectură al setului de instrucțiuni pentru a verifica rezultatul pentru depășire, după fiecare comandă aritmetică, ar trebui să includă o comandă de salt de depășire în program, ceea ce este foarte incomod Adică, în comparație cu verificarea programatică explicită, capturarea excepțiilor economisește timp și memorie Captarea excepțiilor poate fi implementată nu numai în hardware, ci și cu ajutorul firmware-ului prin aceeași verificare explicită În acest caz, atunci când este detectată o depășire, adresa de gestionare a excepțiilor este încărcată în contorul programului Verificarea la nivel de firmware durează mai puțin timp decât verificarea la nivel de program, deoarece poate fi efectuată în același timp cu o altă acțiune În plus, o astfel de verificare economisește memorie, deoarece poate fi implementată doar într-un singur loc, de exemplu, în bucla principală a firmware-ului, indiferent de câte instrucțiuni aritmetice există în programul principal Cele mai frecvente condiții care pot provoca excepții includ: depășirea și dispariția cifrelor semnificative în timpul operațiunilor cu virgulă mobilă, depășirea în timpul operațiunilor cu numere întregi, încălcări de securitate, cod operațional nedefinit, depășire a stivei, pornirea unui dispozitiv I/O inexistent, apel adresa impară cuvinte, împărțire la întreruperi Întreruperile sunt modificări ale fluxului de control care nu sunt cauzate de programul în sine, ci de altceva De obicei, întreruperile sunt asociate cu procesul I/O De exemplu, un program poate instrui discul să înceapă transferul de informații și să declanșeze o întrerupere de îndată ce transferul este complet Ca și în cazul excepțiilor, întreruperile opresc programul și transferă controlul către o rutină a serviciului de întrerupere (ISR) sau către un handler de întreruperi, care efectuează anumite acțiuni După finalizarea acestor acțiuni, operatorul de întrerupere transferă controlul programului întrerupt Trebuie să repornească procesul întrerupt în aceeași stare în care era atunci când a fost întrerupt Aceasta înseamnă că starea anterioară a tuturor registrelor interne (adică starea care era înainte de întrerupere) trebuie restabilită Diferența dintre excepții și întreruperi este că excepțiile sunt sincrone cu programul, în timp ce întreruperile sunt asincrone Dacă programul este repornit de mai multe ori cu aceleași date de intrare, excepții vor apărea de fiecare dată în aceleași locuri din program, dar întreruperile nu vor apărea (în exemplul nostru cu un disc, o întrerupere va apărea numai când discul a completat datele transfer, și nu atunci când este cerut de program) Motivul pentru reproductibilitatea excepțiilor și nereproductibilitatea întreruperilor este că primele sunt apelate direct de program, iar cele din urmă indirect Pentru a înțelege cum funcționează întreruperile, luați în considerare un exemplu comun: un computer trebuie să imprime un șir de caractere pe terminalul său Programul colectează mai întâi toate caracterele destinate afișării pe ecran într-un buffer, inițiind Controlul fluxului Lizează variabila globală ptr, care ar trebui să indice începutul bufferului și face ca a doua variabilă globală să fie egală cu numărul de caractere de afișat Programul verifică apoi dacă terminalul este gata și, dacă este, tipărește primul caracter pe ecran (de exemplu, folosind registrele prezentate în Figura ) Prin pornirea procesului I/O, CPU este eliberat și poate rula un alt program sau poate face altceva După un timp, simbolul este afișat pe ecran După aceea, poate fi declanșată o întrerupere Pașii principali sunt enumerați mai jos (în formă simplificată) Acțiuni hardware: Controlerul dispozitivului încarcă linia de întrerupere pe magistrala de sistem Când CPU este gata să gestioneze o întrerupere, setează caracterul de confirmare a întreruperii pe magistrală Când controlerul dispozitivului detectează că semnalul de întrerupere a fost afirmat, plasează un mic întreg pe liniile de date pentru a se "introduce" (adică pentru a indica ce dispozitiv este sursa întreruperii) Acest număr se numește vector de întrerupere CPU citește vectorul de întrerupere din magistrală și îl stochează temporar CPU-ul împinge contorul de program și cuvântul de stare a programului în stivă CPU localizează noul contor de program folosind vectorul de întrerupere ca index într-un tabel din partea de jos a memoriei Dacă, de exemplu, dimensiunea contorului programului este de octeți, atunci vectorul de întrerupere n corespunde adresei /r Noul contor de program indică începutul rutinei de întrerupere pentru dispozitivul care este sursa întreruperii Adesea, cuvântul de stare a programului este încărcat sau modificat (de exemplu, pentru a bloca întreruperi ulterioare) Alte acțiuni sunt efectuate programatic: Managerul de întrerupere salvează toate registrele de care are nevoie pentru a putea fi restaurate ulterior Ele pot fi stocate pe stivă sau într-o masă de sistem Fiecare vector de întrerupere este partajat de toate dispozitivele de un anumit tip, deci nu se știe încă care terminal a cauzat întreruperea Numărul terminalului poate fi găsit citind valoarea unui registru După aceea, puteți citi orice alte informații despre întrerupere, cum ar fi codurile de stare Autorul nu are dreptate: aici vorbim de numărul de întrerupere Fiecare tip de întrerupere are propriul său număr Termenul "vector de întrerupere" este folosit atunci când adresa operatorului de întrerupere este găsită prin numărul de întrerupere, iar această adresă este reprezentată nu de o singură valoare, ci de mai multe, adică mai mult de un registru trebuie inițializat Cu alte cuvinte, adresa este reprezentată nu ca o valoare scalară, ci ca una multidimensională, vectorială - Notă științific ed Capitolul Stratul de arhitectură al setului de instrucțiuni Dacă apare o eroare I/O, aceasta trebuie tratată în acest moment I Se actualizează variabilele globale ptr și count Primul este incrementat cu pentru a indica următorul octet, iar al doilea este decrementat cu pentru a indica faptul că a mai rămas cu octet mai puțin de ieșit Dacă numărul este încă mai mare decât , atunci nu toate caracterele au fost încă afișate Caracterul indicat în prezent de ptr este copiat în registrul tampon de ieșire Dacă este necesar, se emite un cod special care spune dispozitivului sau controlerului de întrerupere că întreruperea a fost procesată Toate registrele salvate sunt restaurate Comanda de ieșire întrerupere este executată, readucerea CPU la starea în care se afla înainte de întrerupere După aceea, computerul continuă să funcționeze din locul în care a fost suspendat Există un concept important de transparență asociat întreruperilor Când apare o întrerupere, pot fi efectuate diverse acțiuni și pot fi lansate tot felul de programe, dar când totul este terminat, computerul ar trebui să revină exact la aceeași stare în care era înainte de întrerupere Un handler de întrerupere care are această proprietate se numește transparent Dacă computerul are un singur dispozitiv I/O, atunci întreruperile funcționează exact așa cum tocmai am descris Cu toate acestea, un computer mare poate conține multe dispozitive I/O, cu mai multe dispozitive care rulează în același timp, posibil pentru utilizatori diferiți Există o anumită șansă ca, în timp ce gestionarea întreruperilor rulează, un alt dispozitiv I/O va încerca, de asemenea, să declanșeze propria întrerupere Există două abordări aici Primul este ca toți manipulatorii de întreruperi să prevină mai întâi (chiar înainte de salvarea registrelor) întreruperile ulterioare - în acest caz, întreruperile vor avea loc strict pe rând Cu toate acestea, acest lucru poate duce la probleme cu dispozitivele care nu pot fi inactive pentru o perioadă lungă de timp De exemplu, o legătură care acceptă o rată de transmisie de de biți pe secundă primește simboluri la fiecare de microsecunde Dacă primul caracter este neprocesat când sosește al doilea, datele se vor pierde Dacă computerul are dispozitive I/O similare, atunci cel mai bine este să atribuiți o anumită prioritate fiecărui dispozitiv, mare - pentru dispozitivele mai critice, scăzută - pentru dispozitivele mai puțin critice CPU trebuie să aibă și priorități, care sunt determinate de unul dintre câmpurile cuvântului de stare a programului Dacă un dispozitiv cu prioritate n provoacă o întrerupere, operatorul de întrerupere trebuie să ruleze și cu prioritate n Dacă manipulatorul de întreruperi se execută la prioritatea n, orice încercare de a gestiona o întrerupere de la un alt dispozitiv cu o prioritate mai mică va fi ignorată până când gestionarea întreruperilor se va termina și CPU începe să execute programul cu prioritate inferioară În același timp, întreruperile de la dispozitivele cu o prioritate mai mare trebuie procesate fără întârziere Deoarece rutinele de întrerupere în sine pot fi întrerupte, singura modalitate posibilă de a controla cu precizie situația este să vă asigurați că toate Controlul fluxului întreruperile erau transparente Luați în considerare un exemplu simplu cu mai multe întreruperi Lăsați computerul să aibă trei dispozitive de intrare-ieșire: o imprimantă, un disc și o linie RS cu prioritățile , și, respectiv, Inițial (t = , unde t este timpul) programul utilizatorului rulează La t = , imprimanta declanșează în mod neașteptat o întrerupere Rutina de întrerupere a serviciului (ISR) de la imprimantă este pornită, așa cum se arată în fig Întreruperea discului, prioritate , în așteptare Terminați linia RS ISR, primiți întrerupere de disc Întreruperea RSR , prioritate Prioritatea întreruperea imprimantei Închiderea unui disc ISR Oprirea unei imprimante ISR Aproximativ i - L Program! ISR! utilizator! imprimanta! ISR disc ISR! Program ! utilizator !imprimantă Ora -►- linii ISR! RS ! | Utilizator! Utilizator Utilizator Imprimanta Imprimanta [Utilizator! Grămadă Orez Exemplu cu mai multe întreruperi Secvențierea La t = întreruperi sunt necesare de către linia RS Deoarece linia RS are o prioritate mai mare ( ) decât imprimanta ( ), această întrerupere este gestionată Starea mașinii în care rulează imprimanta ISR este stocată în stivă, iar gestionarea întreruperilor de linie RS începe să se execute Puțin mai târziu, la t = , discul își încheie munca și semnalează acest lucru cu o întrerupere Cu toate acestea, prioritatea sa ( ) este mai mică decât prioritatea gestionarului de întrerupere ( ) care rulează în prezent, astfel încât CPU nu confirmă primirea semnalului de întrerupere, iar discul este forțat să aștepte La t = , linia RS ISR se termină și mașina revine la starea în care se afla înainte de întreruperea liniei RS , adică la starea corespunzătoare funcționării ISR imprimantei cu prioritate De îndată ce CPU comută la prioritatea , mai mult înainte ca prima comandă să fie executată, discul cu prioritate se întrerupe și ISR-ul discului este pornit După ce se încheie, rutina de întrerupere a imprimantei continuă din nou În cele din urmă, la t = , toate rutinele de întrerupere se termină și execuția programului utilizatorului se reia de unde a rămas Capitolul Stratul de arhitectură al setului de instrucțiuni De la , toate procesoarele Intel au avut două niveluri (prioritate) de întreruperi: întreruperi mascate și nemascabile Întreruperile nemascabile sunt de obicei folosite doar pentru a raporta situații foarte grave, cum ar fi erorile de paritate a memoriei Toate dispozitivele I/O au o singură întrerupere masabilă Când un dispozitiv I/O solicită o întrerupere, CPU utilizează vectorul de întrerupere în timp ce indexează tabelul cu de intrări pentru a găsi adresa operatorului de întrerupere Intrările din tabel sunt descriptori de segment de octeți Tabelul poate începe oriunde în memorie Registrul global indică începutul său Cu un singur nivel de întrerupere, nu există nicio modalitate ca CPU să aibă un dispozitiv cu prioritate înaltă să întrerupă un handler de întrerupere cu prioritate medie în timp ce un dispozitiv cu prioritate scăzută interferează Procesoarele Intel folosesc de obicei un controler de întrerupere extern (de exemplu A) pentru a rezolva problema La prima întrerupere (de exemplu, cu prioritate i), procesorul este suspendat Dacă apare o altă întrerupere cu prioritate mai mare după aceea, controlerul de întrerupere va declanșa întreruperea a doua oară Dacă a doua întrerupere are o prioritate mai mică, ea nu este inițiată până la sfârșitul primei Pentru ca acest sistem să funcționeze, controlerul de întrerupere trebuie să știe într-un fel că rutina de întrerupere curentă sa încheiat Prin urmare, când procesarea întreruperii curente este complet încheiată, CPU trebuie să trimită o comandă specială controlerului de întrerupere turnul din hanoi Acum că am explorat nivelul arhitecturii setului de instrucțiuni al celor trei mașini, trebuie să rezumam totul Să aruncăm o privire mai atentă la același exemplu de rezolvare a problemei "Turnul din Hanoi") Lista arată versiunea Java a acestui program În următoarele subsecțiuni, vom oferi programe de asamblare Pentium și UltraSPARC III Cu toate acestea, pentru a evita problemele cu Java I/O, pentru mașinile Pentium și UltraSPARC III, vom traduce versiunea programului nu în Java, ci în C Singura diferență este înlocuirea instrucțiunii Java prințip cu o instrucțiune standard în limbaj C : printf("Mutați discul de la la W, , j) Sintaxa liniei din instrucțiunea printf nu este importantă (linia este tipărită literal, cu excepția caracterelor #d, ceea ce înseamnă că următorul întreg va fi reprezentat în notație zecimală) Singurul lucru important aici este că procedura este apelată cu trei parametri: un șir de format și două numere întregi Am folosit limbajul C pentru Pentium și UltraSPARC III deoarece biblioteca Java I/O nu este disponibilă pentru aceste mașini, dar biblioteca C I/O este Diferența este minimă - doar o singură linie de ieșire pe ecran turnul din hanoi Rezolvarea problemei Turnului din Hanoi în asamblatorul Pentium Lista arată un posibil program C pentru un computer Pentium după traducere Registrul EUR este folosit ca indicator de cadru Primele două cuvinte sunt necesare pentru asamblare, astfel încât primul parametru n (sau N, deoarece caracterele sunt insensibile la majuscule și minuscule în macro-asamblatorul) este în celula EBP + , urmat de parametrii i și j în celulele EBP + și EUR + , respectiv Variabila locală k este în EUR + Lista Rezolvarea problemei "Turnul din Hanoi" pentru Pentium MODEL PLAT PUBLIC turnuri EXTERN printf:NEAR COD turnuri: PUSH EBP MOV EBP, ESP CMP[EBP+ ], □NE LI MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] PUSH EAX PUSH OFFSET FLAT:format CALL -prlntf ADD ESP, JMP Gata LI: MOV EAX, SUB EAX, [EBP+ ] SUB EAX, [EBP+ ] MOV [EBP+ ], EAX PUSH EAX MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] DEC EAX PUSH EAX CALL towers ADAUGĂ ESP, MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] PUSH EAX IMPINGAȚI CALL towers ADAUGĂ ESP, MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] PUSH EAX MOV EAX, [EBP+ ] DEC EAX PUSH EAX CALL towers ADAUGĂ ESP, compilat pentru Pentium export 'turnuri' import printf salvați EBP (indicator de cadru) setat nou indicatorul de cadru peste ESP f(n==l) sari daca n nu este egal cu printfi, j); salvând parametrii i, j și format, șirul este împins în stivă în ordine inversă (cerința limbajului C) OFFSET FLAT este adresa de format a apelului la procedura printf eliminarea parametrilor din stivă începe calculul k= -ij ЕАХ= -i ЕАХ= -І-з k=EAX turnuri de începere a procedurii (nl, i, k) ЕАХ=i împinge eu EAX=n EAX=nl împinge n- turnuri de apel de procedură (nl, i, -ij) pe stivă elimină parametrii din stiva începutul procedurii turnuri ( , i, j) împinge j ЕАХ=i împinge eu împinge pe stiva de apeluri towersd i, j) eliminați parametrii din stivă începutul procedurii turnuri (nl, -ij, i) împinge i EAX=k împinge k EAX = n ЕАХ=n- împinge pe stiva n- turnuri de apel de procedură (nl, -ij, i) ajustarea pointerului stivei Capitolul Stratul de arhitectură al setului de instrucțiuni Gata: LEAVE RET ; pregătirea pentru ieșire; reveni la programul de apelare DATE format DB "Mutați unitatea de la Sd la Sd\n" ; șir de format Sfârşit Procedura începe prin crearea unui nou cadru la sfârșitul celui vechi Pentru a face acest lucru, valoarea registrului ESP este copiată în indicatorul de cadru EBP Atunci n este comparat cu , iar dacă n > , săriți la declarația else Apoi, codul împinge trei valori pe stivă: adresa șirului de format, i și j, apoi se autoinvocă Parametrii sunt împinși pe stivă în ordine inversă, deoarece aceasta este o cerință a limbajului C Trebuie să plasați un pointer către șirul de format în partea de sus a stivei Procedura printf are un număr variabil de parametri, iar dacă parametrii sunt împinși pe stivă în ordine directă, procedura nu va ști unde se află șirul de format pe stivă După apelarea procedurii, este adăugat la registrul ESP pentru a elimina parametrii din stivă Ele nu sunt de fapt eliminate din memorie, dar schimbarea registrului ESP le face inaccesibile prin operațiuni normale de stivă Execuția părții el se începe la eticheta L Aici, expresia - - j este mai întâi evaluată, iar valoarea rezultată este stocată în variabila k Stocarea valorii în variabila k elimină necesitatea evaluării acestei expresii a doua oară Procedura se autoapelează apoi de trei ori, de fiecare dată cu parametri noi După fiecare apel, stiva este eliberată Procedurile recursive derutează uneori oamenii Dar, de fapt, nu sunt deloc dificile Parametrii sunt pur și simplu împinși pe stivă, după care procedura se autoapelează Rezolvarea problemei "Turnul din Hanoi" în asamblatorul UltraSPARC III Acum luați în considerare același program de asamblare UltraSPARC III (Listing ) Deoarece programul UltraSPARC III este complet ilizibil chiar și după multă practică, am decis să definim câteva caractere pentru a clarifica lucrurile Pentru ca un astfel de program să funcționeze, trebuie să fie rulat printr-un program numit cpp (preprocesorul C) înainte de asamblare Folosim litere mici aici deoarece asamblerul UltraSPARC III o cere (acest lucru în cazul în care cititorii doresc să tastați acest program și să-l ruleze) Lista Rezolvarea problemei Turnului din Hanoi pentru UltraSPARC III #define N SiO /* #define I Sil /* #define J SI /* #define K SIO /* #define ParamO SoO /* #define Paraml Sol /* #define Param So /* #define Scratch Sil /* N este parametrul de intrare */ I este parametrul de intrare */ J este parametrul de intrare */ K este variabila locală */ ParamO este parametrul de ieșire */ Paraml este parametrul de ieșire */ Param este parametrul de ieșire */ comentariile cpp sunt scrise ca în C*/ turnul din hanoi rgos turnuri globale turnuri: economisiți £sp,- , £sp cmp N, ! dacă(n== ) bne Altceva! dacă (n != ) mergi la Else sethi W(format), ParamO ! printf("Mutați discul c %d în I\n", sau ParamO, Ho(format) ! i, j) , ParamO ! ParamO - format adresa șirului mov I, Paraml ! Paraml = i cai printf ! apelați printf ÎNAINTE de a seta parametrul (j) mov J, Param ! operațiune goală pentru a seta parametrul b Gata! completare acum! introduce o operație goală Altfel: mov , K ! începe calculul k = - -J subK,J,K! k= -j sub K,I,K! k= - -j adăugați N, - , Scratch ! turnuri de pornire a procedurii (nl, i, k) mov Scratch, ParamO! Zgârietură = n- mov I, Paraml ! parametrul = i cai turnuri! turnuri de apel ÎNAINTE de a seta parametrul (k) mov K, Param ! operațiune goală după apel i proceduri pentru setarea parametrului mov , Paramo ! începe procedura towersd, i, j) mov I, Paraml ! parametrul = cai turnuri! turnuri de apel ÎNAINTE de a seta parametrul (J) mov J, Param ! parametrul = j mov Scratch, ParamO! turnuri de pornire a procedurii (n- , k, J) mov K, Paraml ! parametrul = k cai turnuri! turnuri de apel ÎNAINTE de a seta parametrul (J) mov J, Param ! parametrul = j Gata: ret! ieșire din procedură restabili! introduceți comanda goală după ret eu pentru a restabili Windows format: asciz "Mutați discul c £d în M\n" Din punct de vedere algoritmic, versiunea UltraSPARC III este identică cu versiunea Pentium În ambele cazuri, n este verificat mai întâi, iar dacă n > , trece la alt Principalele dificultăți ale versiunii UltraSPARC III sunt legate de unele proprietăți ale arhitecturii instrucțiunilor Codul UltraSPARC III trebuie să treacă mai întâi adresa șirului de format către printf, dar aparatul nu poate muta pur și simplu adresa în registrul care conține parametrul de ieșire, deoarece nu puteți introduce o constantă de de biți în registru într-o singură comandă Acest lucru necesită două comenzi: sethi și og Nu este nevoie să ajustați stiva după apel, deoarece fereastra de înregistrare este ajustată de comanda de restaurare la sfârșitul procedurii Capacitatea de a pune parametrii de ieșire în registre, mai degrabă decât de a accesa memorie, oferă câștiguri semnificative de performanță Acum luați în considerare comanda pore care urmează Terminat Aceasta este o operație goală care va fi întotdeauna executată chiar dacă urmează o comandă setată Capitolul Stratul de arhitectură al setului de instrucțiuni tranziție atrăgătoare Dificultatea constă în faptul că procesorul UltraSPARC III este foarte pipeline, iar în momentul în care o instrucțiune de ramificare este detectată de hardware, următoarea instrucțiune este aproape terminată de procesare Bun venit în lumea minunată a programării RISC! Această caracteristică se extinde și la apelurile de procedură Luați în considerare primul apel la procedura turnurilor în partea el se Procedura plasează n - în %o și i în %oi, dar face un apel către turnuri înainte de a plasa ultimul parametru în locul potrivit Pe un computer Pentium , treci mai întâi parametrii și apoi apelezi procedura Și aici treceți mai întâi o parte din parametri, apoi apelați procedura și abia după aceea treceți ultimul parametru Până când mașina realizează că are de-a face cu instrucțiunea cal , următoarea instrucțiune trebuie să fie executată (din cauza conductei) De ce să nu folosiți o operație goală în acest caz pentru a trece ultimul parametru? Chiar dacă acest parametru este cerut de prima comandă a procedurii apelate, el va fi deja în vigoare În cele din urmă, luați în considerare o parte a comenzii Done Aici, după comanda ret, se introduce și o operație goală Această operație nulă este utilizată pentru comanda de restaurare, care crește CWP cu pentru a restabili fereastra de registru la starea anterioară Arhitectura IA- si procesor Itanium Inevitabil, și foarte curând, va veni momentul în care va fi imposibil să se creeze ceva mai avansat decât modelele existente bazate pe arhitectura de instrucțiuni IA- și pe linia de procesoare Pentium Până acum, noile modele sunt îmbunătățite doar datorită noilor tehnologii de producție care vă permit să reduceți dimensiunea tranzistoarelor, ceea ce înseamnă creșterea frecvenței de ceas În același timp, devine din ce în ce mai dificilă creșterea vitezei de lucru, iar motivul pentru aceasta este limitările inerente arhitecturii de comandă IA- Singura soluție eficientă la problemă este trecerea de la IA- la o nouă arhitectură de instrucțiuni atunci când se dezvoltă noi procesoare Acestea sunt planurile pe care Intel le construiește Mai mult, ar trebui să lanseze două noi linii Prima dintre acestea, numită EMT- , este o versiune extinsă a Pentium cu registre de de biți și un spațiu de adrese de de biți Această arhitectură rezolvă problema spațiului de adrese, dar dificultățile de implementare a Pentium rămân Poate fi numită o versiune extinsă a arhitecturii Pentium O altă arhitectură dezvoltată în comun de Intel și Hewlett Packard se numește IA- Aceasta este deja o mașină cu drepturi depline pe de biți Mai mult decât atât, este izbitor de diferit în multe privințe de Pentium Inițial, IA- ar trebui să fie adus pe piața sistemelor de server profesionale, dar este foarte posibil ca ulterior această arhitectură să câștige un punct de sprijin în computerul desktop segment În orice caz, arhitectura IA- , implementată pentru prima dată în linia de procesoare Itanium, este atât de diferită de tot ceea ce am considerat înainte, încât este pur și simplu necesar să ne familiarizăm cu ea Arhitectura IA- si procesor Itanium mai aproape Deci, restul secțiunii este dedicată arhitecturii IA- ca atare și implementării acesteia în procesoarele din seria Itanium Problema Pentium Înainte de a trece la o discuție detaliată despre arhitectura IA- și procesorul Itanium , este util să înțelegem ce este de fapt în neregulă cu procesorul Pentium și ce probleme intenționează Intel să rezolve prin dezvoltarea unei noi arhitecturi Problema principală este că IA- este o arhitectură veche de instrucțiuni cu proprietăți complet nepotrivite pentru tehnologia modernă Aceasta este o arhitectură CISC tipică cu lungimi diferite de instrucțiuni și un număr mare de formate diferite care sunt dificil de decodat rapid și din mers Tehnologia actuală funcționează cel mai bine cu arhitecturile RISC, în care instrucțiunile au dimensiuni uniforme și codul operațional are lungime fixă, astfel încât este ușor de decodat Deși instrucțiunile de arhitectură IA- pot fi împărțite în micro-operații, cum ar fi instrucțiunile RISC în timpul execuției programului, acest lucru necesită hardware suplimentar (spațiu pe cip) și necesită timp și este dificil de dezvoltat Acesta este primul dezavantaj IA- este o arhitectură de comandă cu două adrese Arhitecturile de instrucțiuni de încărcare/stocare sunt populare în prezent, în care accesările la memorie sunt efectuate doar pentru a plasa operanzi în registre, iar toate calculele sunt efectuate folosind instrucțiuni de registru cu trei adrese Deoarece viteza procesorului crește mult mai repede decât memoria, situația cu ІА- se înrăutățește în timp Acesta este al doilea dezavantaj Arhitectura IA- conține un set mic și neregulat de registre Datorită numărului mic de registre de uz general (patru sau șase, în funcție de locul în care sunt alocate registrele ESI și EDI), rezultatele intermediare trebuie scrise în mod constant în memorie, ceea ce duce la accesări suplimentare la memorie, chiar și atunci când nu sunt în mod logic Necesar Acesta este al treilea dezavantaj Din cauza numărului insuficient de registre, există multe situații de dependență, în special dependențe WAR, deoarece rezultatele intermediare trebuie plasate undeva și nu există registre suplimentare Din cauza lipsei registrelor, se impune constant înlocuirea acestora (adică folosirea registrelor ascunse) Pentru a evita pierderile prea frecvente ale memoriei cache, comenzile trebuie executate în afara ordinului Cu toate acestea, semantica arhitecturii IA- definește întreruperi precise, astfel încât instrucțiunile executate în afara ordinii trebuie să scrie rezultatele în registrele de ieșire în ordine strictă Toate acestea sunt foarte greu de implementat în hardware Acesta este al patrulea dezavantaj Pentru ca viteza de funcționare să fie mare, sistemul trebuie să fie în mare parte canalizat Cu toate acestea, aceasta înseamnă că este nevoie de multe cicluri pentru a executa orice instrucțiune Prin urmare, predicția precisă a ramurilor devine esențială, deoarece numai instrucțiunile necesare trebuie să intre în conductă Cu toate acestea, chiar dacă procentul de predicții incorecte este scăzut, performanța este redusă semnificativ Acesta este al cincilea dezavantaj Capitolul Stratul de arhitectură al setului de instrucțiuni Pentru a evita problemele de predicție greșită a ramurilor, procesorul trebuie să execute instrucțiunile speculative, cu toate consecințele care decurg Acesta este al șaselea dezavantaj Nu vom enumera mai departe deficiențele, deoarece este deja clar că în spatele lor există o problemă reală Ceea ce nu am menționat încă este că adresele IA- pe de biți limitează dimensiunea programelor individuale la GB, ceea ce este o problemă serioasă pentru serverele de înaltă performanță Să presupunem că această problemă este rezolvată în arhitectura EMT- , dar deficiențele rămase rămân Situația cu IA- poate fi comparată cu starea de lucruri din mecanica cerească chiar înainte de apariția lui Copernic La acea vreme, astronomia era dominată de teoria geocentrică, conform căreia Pământul este centrul universului și este staționar, iar planetele se mișcă în jurul lui Cu toate acestea, noi observații au arătat din ce în ce mai multe inconsecvențe ale acestei teorii cu realitatea, ceea ce a dus în cele din urmă la eșecul complet al acesteia Intel se afla aproape in aceeasi pozitie O mulțime de tranzistoare din procesorul Pentium sunt dedicate exclusiv conversiei instrucțiunilor CISC în instrucțiuni RISC, rezolvării conflictelor, predicției de ramificație, corectării previziunilor greșite și rezolvării multor alte probleme de acest fel și doar o mică parte rămâne pentru munca efectivă care utilizatorul chiar are nevoie de aceste tranzistoare Prin urmare, Intel a ajuns la următoarea concluzie: trebuie să aruncați IA- la coșul de gunoi și să o luați de la capăt (IA- ) Arhitectura EMT- este destinată doar să câștige ceva timp, lăsând problema nerezolvată Model IA- - calcule cu paralelism explicit de instrucțiuni Principiul de bază al organizării arhitecturii IA- este de a muta încărcarea de la timpul de execuție la timpul de compilare Procesorul Pentium reordonează instrucțiunile, înlocuiește registre, alocă blocuri funcționale și îndeplinește multe alte funcții în timpul execuției, ceea ce duce la utilizarea maximă a tuturor resurselor hardware În modelul IA- , aceste sarcini sunt rezolvate în avans de către compilator Ca rezultat, generează un program care poate fi executat fără manipulare nejustificată a hardware-ului De exemplu, în Pentium , compilatorul primește informații că există doar registre în mașină, deși sunt de fapt dintre ele, ca urmare, în timpul execuției programului, trebuie să ieși cumva pentru a evita interdependențele Conform arhitecturii IA- , compilatorul primește informații fiabile despre numărul de registre din mașină și apoi generează un program în care nu există conflicte între registre În plus, compilatorul monitorizează încărcarea blocurilor funcționale și nu rulează instrucțiuni care ar trebui să se refere la blocuri funcționale ocupate Modelul în care paralelismul hardware este vizibil pentru compilator se numește EPIC (Explicitly Parallel Instruction Computing) Arhitectura IA- si procesor Itanium comenzi) Într-o anumită măsură, modelul EPIC poate fi considerat o evoluție a tehnologiei RISC Unele caracteristici ale IA- cresc semnificativ productivitatea Printre acestea se numără reducerea numărului de accesări la memorie, programarea instrucțiunilor, reducerea numărului de salturi condiționate și operațiuni speculative Vom discuta despre toate aceste caracteristici atât din punct de vedere teoretic, cât și în contextul implementării lor în Itanium Reducerea numărului de accesări la memorie Modelul de memorie Itanium este destul de simplu În total, sunt furnizați de octeți de memorie liniară Comenzile disponibile vă permit să accesați blocuri de memorie de , , , , și octeți (aceasta din urmă valoare a fost introdusă pentru compatibilitatea cu numerele în virgulă mobilă de de biți ale standardului IEEE ) Nu există o nevoie categorică de a alinia accesele la memorie de-a lungul granițelor naturale, dar performanța este mai scăzută fără aliniere Memoria poate fi fie big endian, fie little endian; un format sau altul este setat de un bit special într-un registru încărcat de sistemul de operare Accesul la memorie în computerele moderne este considerat un blocaj Acest lucru se datorează faptului că procesoarele funcționează mult mai rapid decât modulele de memorie Numărul de accesări la memorie poate fi redus prin plasarea unui cache mare de prim nivel pe cipul procesorului și a unui cache și mai mare de nivel al doilea în imediata apropiere a cipului Două module de memorie cache sunt echipate cu toate procesoarele moderne În același timp, există și alte metode pentru a reduce cantitatea de interacțiune cu memorie, iar unele dintre ele sunt implementate în IA- Cea mai bună modalitate de a accelera accesul la memorie este să efectuați această operație în fundal Procesorul Itanium are de registre de uz general pe de biți Primele dintre ele sunt statice, iar restul de sunt grupate într-o stivă de registre, care amintește de o fereastră de registre UltraSPARC III Spre deosebire de UltraSPARC, numărul de registre disponibile pentru un program variază de la o procedură la alta Ca rezultat, fiecare procedură are acces la de registre statice și un număr (variabil) de registre alocate dinamic Când procedura este apelată, indicatorul stivei de registre este deplasat astfel încât parametrii de intrare să fie vizibili în registre, dar registrele în sine nu sunt distribuite între variabilele locale Procedura în sine determină numărul de registre de care are nevoie și mută indicatorul stivei în consecință Nu este nevoie să salvați conținutul acestor registre la intrare și să le restaurați la ieșire, deși dacă o procedură trebuie să modifice un registru static, trebuie mai întâi să-și salveze în mod explicit valoarea anterioară și apoi să o restabilească Deoarece numărul de registre este exprimat printr-o variabilă disponibilă și este determinat de cerințele fiecărei proceduri particulare, utilizarea ineficientă a registrelor este eliminată In afara de asta, Capitolul Stratul de arhitectură al setului de instrucțiuni profunzimea maximă a apelurilor de procedură este crescută, la care nu este necesar ca registrele să fie "transformate" în memorie Itanium are de registre în virgulă mobilă organizate conform standardului IEEE și nestivuite Un număr mare de registre de acest tip vă permite să stocați rezultatele intermediare ale multor operații cu virgulă mobilă în registre fără a le muta în memorie În plus, Itanium oferă de registre de predicate de bit, registre de ramuri și de registre de aplicații specializate care sunt utilizate pentru o varietate de scopuri, cum ar fi schimbul de parametri între programele de aplicație și sistemul de operare Schema generală a registrelor Itanium este prezentată în fig registre generale de registre în virgulă mobilă de registre de predicate de bit de registre utilizate ca stivă de registre de registre statice registre aplicate registre de filiale Orez Itanium registre Planificarea echipei Unul dintre cele mai grave dezavantaje ale Pentium este dificultatea de a programa instrucțiunile pentru procesare în diferite blocuri funcționale fără interdependențe Pentru a rezolva această problemă în timpul execuției, sunt implicate mecanisme foarte complexe, al căror suport hardware necesită mult spațiu pe cip În arhitectura IA- și implementarea acesteia - Itanium - aceste probleme sunt rezolvate prin transmiterea funcțiilor corespunzătoare la compilator Fiecare program constă acum dintr-o secvență de grupuri de instrucțiuni Comenzile din cadrul aceluiași grup nu intră în conflict între ele, nu consumă mai multe resurse și nu accesează mai multe blocuri funcționale decât cele oferite de sistem, nu formează interdependențe RAW și WAW (interdependențele WAR sunt permise într-o măsură limitată) Avem impresia că grupurile succesive de instrucțiuni sunt executate strict în ordine, deși, de fapt, dacă este sigur, procesorul poate rula o parte din instrucțiunile grupului următor înainte ca cel precedent să fie finalizat Astfel, procesorul poate programa execuția instrucțiunilor în cadrul fiecărui grup individual în orice ordine, dacă este posibil - în paralel Arhitectura IA- si procesor Itanium modul nominal În acest caz, probabilitatea de conflicte între echipe este zero Dacă un grup de comenzi încalcă regulile de mai sus, comportamentul programului devine nedefinit Într-o astfel de situație, responsabilitatea de a se asigura că codul de asamblare obținut din programul sursă respectă toate cerințele revine compilatorului Pentru a compila rapid în timpul depanării programului, compilatorul poate pune fiecare comandă într-un grup separat; acest lucru este simplu de făcut, dar performanța este redusă ca urmare a acestei operațiuni, iar timpul de optimizare a codului de ieșire este semnificativ crescut Comenzile sunt combinate în pachete de de biți, ca cel prezentat în partea de sus a Fig Fiecare pachet conține trei instrucțiuni pe de biți și un model de biți Numărul de fascicule dintr-un grup de comenzi nu este întotdeauna exprimat ca un întreg - în unele cazuri, grupurile încep și se termină în mijlocul fasciculelor biți biți Grup de operații registrul de predicate Orez Fasciculul din arhitectura IA- este format din trei comenzi Există peste de formate de comandă Pe fig arată cel mai comun format În acest caz, este folosit pentru a efectua operația ADD cu ALU, care plasează suma a două registre în al treilea Câmpul grup de operații definește clasa generală a instrucțiunii (de exemplu, operația ALU cu numere întregi) Câmpul tip tranzacție indică tranzacția specifică (de exemplu, ADD sau SUB) Urmează trei câmpuri de înregistrare Ultimul câmp al acestui format, câmpul registrului de predicate, va fi discutat puțin mai târziu Șablonul de pachet indică ce blocuri funcționale sunt necesare pentru a-l procesa și, de asemenea, determină poziția limitei grupului de instrucțiuni (dacă există) Principalele blocuri funcționale sunt instrucțiuni ALU întregi și non-întregi, accesări la memorie, operații cu virgulă mobilă, ramificare etc Evident, cu blocuri și instrucțiuni, sunt necesare combinații de bază pentru ortogonalitatea completă, plus x combinații suplimentare pentru a determina grupați marcatorii după comenzile , și Deoarece sunt disponibili doar biți, sunt permise doar câteva dintre varietatea de combinații Pe de altă parte, dacă trei instrucțiuni în virgulă mobilă ar putea fi incluse în pachet simultan, procesorul pur și simplu nu ar putea Capitolul Stratul de arhitectură al setului de instrucțiuni rulați-le în același timp Astfel, combinațiile efectiv fezabile sunt considerate valide Reducerea numărului de salturi condiționate - predicție O altă caracteristică a arhitecturii IA- este un nou mod de a gestiona salturile condiționate Dacă ar fi posibil să scăpăm de majoritatea, procesorul ar fi mult mai simplu și ar rula mult mai rapid La prima vedere, ar putea părea imposibil să eliminați salturile condiționate, deoarece programele sunt întotdeauna pline de instrucțiuni if Cu toate acestea, arhitectura IA- folosește o tehnologie specială numită predicție, care poate reduce foarte mult numărul lor [ , ] Să descriem pe scurt această tehnologie În mașinile de astăzi, toate instrucțiunile sunt necondiționate în sensul că atunci când CPU întâlnește o instrucțiune, pur și simplu o execută Aici întrebarea nu este niciodată rezolvată: "A performa sau a nu face?" Dimpotrivă, într-o arhitectură de predicat, comenzile conțin condiții care vă spun când să executați comanda și când nu Această tranziție de la comenzile necondiționate la comenzile predicate este cea care ne permite să scăpăm de multe salturi condiționate În loc să alegeți una sau alta secvență de comenzi necondiționate, toate comenzile sunt îmbinate într-o singură secvență de comenzi predicate, în care diferite comenzi au predicate diferite Pentru a înțelege cum funcționează predicția, luați în considerare un exemplu simplu (listele - ) care arată execuția condiționată a comenzilor (execuția condiționată este precursorul predicației) În Lista , vedem o declarație if În Listarea , după ce a fost tradus, au existat trei comenzi: comparați, săriți și mutați În Listarea , am scăpat de saltul condiționat folosind noua instrucțiune CMOVZ, care este o instrucțiune de mutare condiționată Această instrucțiune verifică dacă al treilea registru R este egal cu zero Dacă da, atunci comanda copiază R în R Dacă nu, comanda nu face nimic Lista - - Declarația if dacă (Rl== ) R = R ; Lista - - Cod de asamblare pentru Lista CMP R BNE L MOV-R , R L : Lista - - Comandă condiționată CMOVZ R R R Dacă avem o instrucțiune care poate copia date atunci când orice registru este zero, atunci putem avea și o instrucțiune care copiază datele dacă orice registru nu este zero Să fie aceasta comanda CMOVN Cu ambele comenzi la locul lor, suntem deja pe drumul spre execuția completă condiționată Imaginați-vă o instrucțiune іf cu mai mulți operatori de atribuire în partea apoi și mai mulți operatori de atribuire în partea el se Toate acestea frag Arhitectura IA- si procesor Itanium Elementul programului poate fi tradus în cod care va seta un registru la dacă condiția nu este îndeplinită și la o altă valoare dacă condiția este îndeplinită Astfel, asignările din partea apoi pot fi compilate într-o secvență de instrucțiuni CMOVN, iar asignările din partea el se pot fi compilate într-o secvență de instrucțiuni CMOVZ Toate aceste instrucțiuni, inclusiv instrucțiunile setului de registre, CNOVN și CMOVZ, formează un singur bloc principal fără salturi condiționate Comenzile pot fi chiar reordonate în timpul compilării sau în timpul executării Singura cerință este ca condiția să fie cunoscută până în momentul în care instrucțiunile condiționate trebuie să fie plasate în registrele de ieșire (adică undeva la capătul conductei) Un exemplu simplu de fragment de program cu instrucțiuni then și else este prezentat în Listările - Lista - , Declarația if dacă(Rl == ) { R = R ; R = R : } else { R =R ; R =R ; Lista - - Cod de asamblare pentru Lista CMP R BNE L MOV-R R MOV R R BR L LI:MOV-R R MOV-R -R L : Lista - Execuție condiționată CMOVZ R R R CMOVZ R R R CMOVN R R R CMOVN R R R Am arătat doar instrucțiuni condiționale foarte simple (luate din arhitectura de instrucțiuni Pentium ), dar în arhitectura IA- toate instrucțiunile sunt predicate Aceasta înseamnă că execuția fiecărei comenzi poate fi condiționată Câmpul suplimentar pentru Registrul de predicați pe biți pe care l-am menționat vă permite să selectați unul dintre cele de registre de predicate pe biți Prin urmare, instrucțiunea if poate fi compilată într-un cod care setează unul dintre registrele de predicat la dacă condiția este adevărată și la dacă condiția este falsă Celălalt caz predicat este inversat simultan și automat Astfel, cu suportul predicației, instrucțiunile mașinii care sunt formate din instrucțiunile then și el se se contopesc într-un singur flux de instrucțiuni, iar instrucțiunile primei dintre ele au un câmp de registru de predicate de unul, în timp ce al doilea are un zero unu Listările - arată cum să folosiți predicția pentru a elimina tranzițiile Instrucțiunea CMPEQ compară două registre și setează registrul predicat P la dacă acestea sunt egale și la dacă nu sunt egale În plus, comanda inversează un alt registru, de exemplu, P După aceea piesele comandă Capitolul Stratul de arhitectură al setului de instrucțiuni dacă și atunci pot fi plasate unul după altul, iar fiecare dintre ele este asociat cu un anumit caz predicat (cazul este indicat în paranteze unghiulare) Orice cod poate fi plasat aici, atâta timp cât fiecare comandă este prezisă corect Lista - - Declarația if f(Rl == R ) R =R +R : Altfel R = R - R Lista - - Cod de asamblare pentru listare CMP R R BNE L MOV-R R ADAUGĂ R R BR L LI: MOV-R R SUB-R -R L : Lista - - Execuția predicatelor CMPEQ R R P ADAUGĂ R ,R ,R SUB R R R În arhitectura IA- , această idee este adusă la concluzia sa logică - aici comenzile de comparație, comenzile aritmetice și unele alte comenzi sunt asociate cu registrele de predicate Instrucțiunile predicate pot fi plasate secvenţial în conductă, fără probleme sau timpi de nefuncţionare Prin urmare, sunt foarte utile În arhitectura IA- , predicția are loc după cum urmează Fiecare instrucțiune este de fapt executată, iar la sfârșitul conductei, când este deja necesară stocarea rezultatului în registrul de ieșire, se verifică dacă predicția este adevărată Dacă da, rezultatele sunt pur și simplu scrise în registrul de ieșire Dacă predicția este falsă, atunci registrul de ieșire nu este scris Puteți citi mai multe despre predicție în literatura suplimentară [ ] Încărcare speculativă O altă caracteristică a IA- care îmbunătățește performanța este suportul pentru încărcare speculativă Dacă instrucțiunea LOAD este speculativă și nu funcționează, atunci în loc să arunce o excepție, pur și simplu se oprește din execuție și raportează că registrul în care trebuia să fie încărcat este invalid Acesta folosește același bit otravă pe care l-am menționat în capitolul Și o excepție va fi aruncată numai dacă apoi încercați să utilizați acest registru De obicei, la încărcarea speculativă, compilatorul plasează comenzi LOAD înaintea altor comenzi Deoarece aceste comenzi încep să se execute mai devreme decât ar trebui, ele se pot finaliza înainte ca rezultatele să fie necesare În locul în care trebuie să obțină valoarea unui anumit registru, compilatorul introduce comanda SNECK Dacă valoarea este deja acolo, comanda SNESK funcționează Rezumatul capitolului se topește în același mod ca NOP, iar execuția programului continuă imediat Dacă încă nu există nicio valoare în registru, următoarea instrucțiune este forțată să fie inactivă În concluzie, putem spune că în mașinile cu arhitectura IA- sunt implementate mai multe mecanisme de creștere a performanței În primul rând, este o mașină RISC modernă, canalizată, cu trei adrese, care acceptă un mecanism de încărcare/stocare În al doilea rând, compilatorul determină ce instrucțiuni pot fi executate în același timp și, fără conflict, grupează aceste instrucțiuni în pachete Astfel, procesorul poate programa pur și simplu procesarea fasciculelor fără să se gândească la vreo verificare În al treilea rând, predicția vă permite să combinați comenzile ambelor ramuri în operatorul f, eliminând în același timp atât ramura condiționată, cât și necesitatea de a prezice această ramură În cele din urmă, încărcarea speculativă permite apelarea operanzilor înainte de timp și, chiar dacă mai târziu se dovedește că acești operanzi nu sunt necesari, nu se va întâmpla nimic rău Informații suplimentare despre procesorul Itanium și microarhitectura acestuia pot fi găsite în literatura suplimentară [ , ] Rezumatul capitolului Pentru majoritatea oamenilor, nivelul arhitecturii setului de instrucțiuni este "limbajul mașinii" La acest nivel, aparatul are memorie de octeți sau de cuvinte de câteva zeci de megaocteți și conține instrucțiuni precum MOVE, ADD și BEQ În majoritatea computerelor moderne, memoria este organizată ca o secvență de octeți, cu sau octeți grupați în cuvinte De obicei, o mașină are între și de registre, fiecare conținând un cuvânt La unele mașini (de exemplu, în Pentium ) atunci când se accesează cuvinte de memorie, alinierea pe granițele naturale ale celulelor nu este necesară, în altele (de exemplu, în UltraSPARC III) aceasta este o condiție obligatorie Instrucțiunile au de obicei , sau operanzi, care sunt accesați folosind diverse moduri de adresare: imediat, direct, înregistrare, index etc Instrucțiunile pot de obicei muta date, efectua operații unare și binare (inclusiv aritmetice și logice), face salturi, apelează proceduri, execută bucle și, uneori, unele I/O Instrucțiunile tipice mută un cuvânt din memorie într-un registru sau invers, se adună, se scad, se înmulțesc sau se împart două registre sau un registru și un cuvânt din memorie sau se compară două valori în registre sau memorie Destul de des, numărul de instrucțiuni din computere depășește În procesoarele CISC, există și mai multe Pentru a transfera controlul la nivelul arhitecturii instrucțiunilor, sunt utilizate diverse primitive: sărituri, proceduri de apelare și coroutine, captarea excepțiilor și gestionarea întreruperilor Salturile sunt folosite pentru a opri o secvență de comenzi și a porni una nouă Procedurile vă permit să selectați un fragment al programului, care poate fi apoi apelat din diferite locuri din același program Coroutinele permit două fire de control să ruleze în paralel Captarea excepțiilor este utilizată pentru a semnala situații excepționale (de exemplu, o depășire) Mecanism de întrerupere Capitolul Stratul de arhitectură al setului de instrucțiuni vă permite să efectuați I/O în paralel cu calculele principale, în timp ce de îndată ce I/O este finalizată, CPU primește un semnal despre aceasta Problema Turnului din Hanoi poate fi rezolvată folosind recursiunea În cele din urmă, arhitectura IA- utilizează modelul de calcul EPIC, care simplifică implementarea paralelismului în programe Pentru a îmbunătăți performanța, această arhitectură asigură gruparea instrucțiunilor, predicția și încărcarea speculativă Arhitectura IA- poate fi un bun înlocuitor pentru Pentium , chiar dacă impune o sarcină grea compilatorului în ceea ce privește menținerea paralelismului Întrebări și sarcini Un cuvânt dintr-un sistem big endian i se atribuie valoarea numerică Să presupunem că acest cuvânt este transferat octet cu octet și stocat într-un sistem big endian, cu octetul sursă corespunzând octetului destinație și așa mai departe valoarea numerică a unui cuvânt într-un sistem big-endian? În Pentium , instrucțiunile pot conține orice număr de octeți, chiar și impari În UltraSPARC III, toate comenzile conțin un număr par de octeți Care este avantajul Pentium ? Dezvoltați un cod operațional extins care vă permite să codificați următoarele într-o instrucțiune pe de biți: + echipe cu două adrese de de biți și un număr de registru de biți; + de comenzi cu o adresă de biți și un număr de registru de biți; + de comenzi fără adrese și registre Lăsați mașina să accepte comenzi pe biți și adrese pe biți Unele comenzi conțin o adresă, altele două Dacă există n instrucțiuni cu două adrese, care este numărul maxim de instrucțiuni cu o singură adresă? Este posibil să se dezvolte un astfel de cod operațional extins care să permită codificarea următoarelor într-o instrucțiune de biți (dimensiunea registrului este de biți): + comenzi cu trei registre; + de comenzi cu un singur registru; + comenzi fără registre Să existe o mașină unicast cu un registru de adunare Iată semnificațiile unor cuvinte de memorie: + cuvântul conține numărul ; + cuvântul conține numărul ; Întrebări și sarcini + cuvântul conține numărul ; + cuvântul conține numărul ; Ce valori se vor încărca următoarele comenzi în registrul totalizatorului? ÎNCĂRCARE IMMEDIATĂ ÎNCĂRCARE DIRECT ÎNCĂRCARE INDIRECTA ÎNCĂRCARE IMMEDIATĂ ÎNCĂRCARE DIRECT ÎNCĂRCARE INDIRECTA Pentru fiecare dintre cele patru tipuri de mașini - fără adresă, uni-adresă, cu două adrese și cu trei adrese - scrieți un program pentru a evalua următoarea expresie: X \u d (A + B x C) / (D -ExF) Sunt disponibile următoarele comenzi: + fără adresă: PUSH M, POP M, ADD, SUB, MUL, DIV; + unicast: LOAD M, STORE M, ADD M, SUB M, MUL M, DIV M; + două adrese: MOV (X = Y), ADD (X = X + Y), SUB (X = X - Y), MUL (X = X x Y), DIV (X = X/Y); + trei adrese: MOV (X = Y), ADD (X = Y + Z), SUB (X = Y - Z), MUL (X = Y x Z), DIV (X = Y / Z) Aici M este o adresă de memorie de biți, iar X, Y și Z sunt fie adrese de biți, fie registre de biți Mașina neadresată folosește o stivă, mașina unicast folosește un registru de acumulator, iar celelalte două au registre și instrucțiuni care funcționează pe toate combinațiile de locații și registre de memorie Instrucțiunea SUB X,Y scade Y din X, iar instrucțiunea SUB X,Y,Z scade Z din Y și pune rezultatul în X Dacă lungimea codului operațional este de biți și dimensiunile instrucțiunii sunt multipli de biți, câți biți are nevoie fiecare mașină pentru calcule X? Veniți cu un mecanism de adresare care vă permite să definiți un set arbitrar de de adrese într-un câmp de biți, nu neapărat adiacent Care este dezavantajul programelor automodificatoare care nu a fost menționat în textul acestui capitol? Schimbați următoarele formule de la notația infixă la notația poloneză inversă: ) A + B + C + D + E; ) (L + B) x (C + D) + E; ) (ЛхВ) + (Схй) + £; ) (L - B) x (((C - D x E) / F) / G) x I I Care dintre următoarele perechi de formule în notație poloneză inversă sunt echivalente din punct de vedere matematic? ) L B + C + și L B C + +; ) AB-C-iABC ; ) LVxS+iLAN + x Capitolul Stratul de arhitectură al setului de instrucțiuni Convertiți următoarele formule din notație poloneză inversă în notație infixă: ) AB + C + D x; ) AB / C D / +; ) ABCDE + xx/ ) AB CDExF / + G - H / x+ Scrieți trei formule în notație poloneză inversă care nu pot fi convertite în notație infixă Convertiți următoarele formule logice infixe la notația poloneză inversă: ) (A ȘI B) SAU C; ) (A SAU B) ȘI (A SAU ; ) (A ȘI B) SAU (C ȘI D) Schimbați următoarea formulă infixă pentru a inversa notația poloneză și scrieți codul IJVM pentru a o executa: ( x + )-( / + ) Să existe o comandă de asamblare: MOV REG,ADDR Aceasta este o comandă Pentium pentru a încărca un registru din memorie, dar pe un UltraSPARC III, pentru a încărca un registru din memorie, scrieți: LOAD ADDR REG De ce operanzii sunt scrisi în ordine diferită? Câte registre sunt în aparat, ale căror formate de comandă sunt prezentate în fig ? În formatele de comandă din fig bit face posibilă distingerea între opțiunile de format și Cu toate acestea, nu este furnizat niciun bit special pentru a defini opțiunea de format De unde știe hardware-ul că este necesară opțiunea ? În mod normal, un program localizează variabila X în intervalul de la A la B Dacă ar exista o instrucțiune cu trei adrese cu operanzi A, B și X, câți biți din codul de condiție ar fi setați de această instrucțiune? Pentium conține un bit de cod de condiție, a cărui stare depinde de transportul bitului după ce a fost efectuată o operație aritmetică De ce este nevoie de asta? Nu există nicio instrucțiune în UltraSPARC III care să încarce un număr de de biți într-un registru În schimb, se folosește de obicei o secvență de două comenzi: SETHI și ADD Există alte modalități de a încărca un număr de de biți într-un registru? Argument Unul dintre prietenii tăi îți bate la ușă la dimineața și anunță cu bucurie că a avut o idee grozavă - să creeze o echipă cu două coduri de funcționare Ce vei face în această situație: trimite-ți prietenul să obțină un brevet sau trimite-l (gândește-te mai departe)? Întrebări și sarcini Procesorul nu oferă instrucțiuni de offset mai mari de biți Înseamnă asta că adresarea memoriei în intervalul de peste nu este posibilă? Dacă este posibil, explicați cum se face Următoarele forme de verificare sunt foarte frecvente în programare: dacă (k== ) dacă (a>b) dacă (k semafor = semafor + (dacă un alt proces încearcă acum să reducă operația pe acest semafor, poate face acest lucru și își poate continua activitatea) Semafor = semafor + jos Procesul este suspendat până când un alt proces efectuează o operație ip pe acest semafor Semafor = semafor - După cum sa menționat deja, problema rasei poate fi rezolvată prin intermediul limbajului Java, dar acum discutăm despre sisteme de operare, prin urmare, trebuie să implementăm cumva mecanismul semaforului în Java, deoarece nu există o clasă standard pentru ele Cu toate acestea, putem face acest lucru presupunând că cele două metode, sus și jos, care fac apelurile de sistem în sus și respectiv în jos, au fost deja scrise și folosesc numere întregi obișnuite ca parametri Lista arată cum puteți rezolva condițiile de cursă folosind semafoare La clasa m se adaugă două semafore: un semafor disponibil, setat inițial la (aceasta este dimensiunea tamponului) și un semafor filat, setat inițial la Producătorul începe cu o instrucțiune P , iar consumatorul începe cu o declarație C Apelarea la semaforul fi lied suspendă imediat consumatorul Când producătorul găsește primul număr, apelează metoda down cu variabila disponibilă ca parametru, setând-o la În instrucțiunea P , producătorul apelează metoda cu parametrul fii led, setând fi lied la Această acțiune eliberează consumatorul, care acum poate finaliza apelarea metodei down După aceea, fi lied devine și ambele procese continuă Să ne întoarcem din nou la curse Fie la un moment dat ip = , și out = , producătorul execută operatorul P , iar consumatorul execută operatorul C Consumatorul finalizează acțiunea și trece la instrucțiunea C , care apelează metoda down pe semaforul fi liat, care era înainte de apel și după apel, ia valoarea Consumatorul introduce acest număr și trece la instrucțiunea C Chiar înainte ca consumatorul să fie pe cale să apeleze metoda down, producătorul generează următorul număr și execută rapid P , P și P În acest moment, fii led = Producătorul va apela metoda up pe acest semafor, iar metoda down va fi apelată de consumator Dacă consumatorul face primul apel, acesta va fi suspendat până când producătorul îl eliberează (prin apelarea metodei ip) Dacă producătorul face primul apel, atunci sema Capitolul Stratul sistemului de operare for va fi setat la și consumatorul nu va fi deloc întrerupt În ambele cazuri, semnalul de declanșare nu se va pierde De aceea am introdus semafoare în program Lista Funcționare în paralel folosind semafore clasa publica m { final public static int BUF SIZE = ; // tampon de la la final public static long MAX PRIME= L; // opriți aici public static int in = , out = ; // indicii către date public static long buffer[ ] = nou lung[BUF SIZE]; // numerele sunt stocate aici producator public static p; // numele fabricantului consumator public static c; // numele consumatorului public static int fi led = disponibil = ; // semafoare public static void main(String args[ ]) { // clasa principală p = nou producatorO; // creează un producător c = nou consumatorO; // creează consumator R startO; // începe producătorul Cu startO; // porniți consumatorul } // Aceasta este o funcție de aplicație pentru incrementarea ciclică a ip și în afara public static int next(int k) {if (k ) write(outfd, buffer count); } în timp ce (număr > ); /* Închide fișierele */ close(infd); close(outfd); Apelul de citire are trei parametri: un descriptor de fișier, un buffer și un număr de octeți Acest apel trebuie să citească numărul necesar de octeți din fișierul specificat în buffer Numărul de octeți citiți este plasat în variabila de numărare Valoarea numărului poate fi mai mică de octeți dacă fișierul este prea scurt Apelul de scriere copiază octeții citiți în fișierul de ieșire Bucla continuă până când fișierul de intrare a fost citit complet Apoi bucla se termină și ambele fișiere sunt închise Descriptorii de fișiere în UNIX sunt numere întregi mici (de obicei până la ) Descriptorii de fișiere , și corespund intrării standard, ieșirii standard și, respectiv, erorii standard De obicei, primul se referă la tastatură, iar al doilea și al treilea la afișaj, deși este util Capitolul Stratul sistemului de operare Dezvoltatorul poate redirecționa orice flux standard de intrare/ieșire către un fișier Multe programe UNIX preiau intrarea de la intrarea standard și scriu ieșirea la ieșirea standard Astfel de programe se numesc filtre Directorul rădăcină Fișiere de date Orez Un fragment din sistemul de directoare al sistemului de operare UNIX Exemple de sisteme de operare Strâns legat de sistemul de fișiere este sistemul de directoare Fiecare utilizator poate avea mai multe directoare, iar fiecare director poate conține fișiere și subdirectoare Un sistem UNIX este de obicei configurat cu un director principal, așa-numitul director rădăcină, care conține subdirectoare bin (pentru programele utilizate în mod obișnuit), dev (pentru fișiere speciale de dispozitiv I/O), ib (pentru biblioteci) și usr (pentru directoarele utilizatorilor, cum este prezentat în Fig ) În exemplul nostru, directorul usr conține subdirectoarele ast și jim Directorul ast include două fișiere (data și foo c) și un subdirector bin care conține fișiere (gamei, game , ) Pentru a denumi un fișier, trebuie să specificați calea acestuia din directorul rădăcină Calea conține o listă a tuturor directoarelor de la directorul rădăcină la fișier, barele oblice sunt folosite pentru a separa directoarele De exemplu, calea către fișierul game este /usr/ast/bin/game O cale care începe la directorul rădăcină se numește cale absolută În orice moment, fiecare program care rulează are un director curent Calea poate fi legată de directorul curent În acest caz, nu este plasată nicio bară oblică la începutul căii (pentru a o distinge de o cale absolută) O astfel de cale se numește cale relativă Dacă /usr/ast este directorul curent, atunci fișierul date poate fi accesat folosind calea bin/date Utilizatorul poate crea un link către fișierul altcuiva utilizând apelul de sistem link În exemplul nostru, căile /usr/ast/bin/date și /usr/jim/jotto conduc la același fișier Nu este permisă aplicarea de legături către directoare pentru a preveni ciclurile în sistemul de directoare Apelurile deschise și create pot folosi căi absolute sau relative Principalele apeluri pentru manipularea directoarelor UNIX sunt enumerate în Tabelul Apelarea mkdir creează un director nou, iar rmdir elimină un director gol existent Următoarele trei apeluri sunt folosite pentru a citi intrările din director Primul deschide directorul, al doilea citește elemente din acesta, al treilea închide directorul Apelarea chdir schimbă directorul curent Tabelul Apeluri de bază pentru lucrul cu directoare pe un sistem UNIX Apel de sistem Descriere mkdir(nume, mod) Creați un director nou rmdir(nume) Eliminați un director gol Opendir(nume) Deschide un director pentru citire readdir(dirpointer) Citiți următorul element dintr-un director Closedir(dirpointer) Închide un director chdir(dirname) Schimbați directorul curent în directorul numit dirname Iink(name , name ) Creați o asociere (nume intrare în director care indică directorul namel) unlink(name) Eliminați o legătură (element cale) dintr-un director Apelarea la nk creează o intrare de director care indică un fișier deja existent De exemplu, elementul /usr/jim/jotto poate fi creat prin apelare nk ("/usr/ast/Yn/game ", "/usr/jim/jotto") Capitolul Stratul sistemului de operare Același lucru se poate realiza cu un apel echivalent folosind căi relative care depind de directorul curent Apelul de deconectare elimină intrarea din director Dacă fișierul are un singur link, acesta este șters Dacă un fișier are două sau mai multe legături, atunci nu este șters Nu contează dacă legătura de la distanță a fost creată inițial sau dacă este o copie Următorul apel face fișierul date disponibil numai prin calea /usr/jim/jotto: unii nk ("/usr/ast/bip/date ") Apelurile nk și uni ink pot fi folosite pentru a muta fișiere dintr-un director în altul Fiecare fișier (și, de asemenea, fiecare director, deoarece un director este și un fișier) are asociat un bitmap care spune cui are permisiunea de a accesa fișierul Cardul conține trei câmpuri RWX (Read, Write, eXecute - citire, scriere, execuție) Primul dintre ei controlează permisiunea de a citi, scrie și executa fișiere pentru proprietarul lor, al doilea - pentru alți utilizatori din grupul proprietarului, al treilea - pentru toți ceilalți utilizatori De exemplu, biții RWX RX X înseamnă că proprietarul fișierului poate citi acest fișier, scrie ceva în el și îl poate executa (evident, fișierul este un program executabil, altfel nu ar exista permisiunea de a-l executa), alți membri ai grupului o pot citi și face, iar toți ceilalți doar o fac Astfel, utilizatorii neautorizați vor putea executa acest program, dar nu îl vor putea fura (copia), întrucât le este interzis să îl citească Includerea utilizatorilor în anumite grupuri este efectuată de administratorul de sistem, care este de obicei numit utilizator privilegiat Un utilizator privilegiat are dreptul de a acționa împotriva mecanismului de protecție și de a citi, scrie și executa orice fișier Acum să vedem cum sunt implementate fișierele și directoarele în sistemul UNIX Vezi [ ] pentru o descriere mai detaliată Fiecare fișier (și fiecare director, deoarece un director este și un fișier) are asociat un bloc de informații de de octeți numit inode (i-node) Inodul conține informații despre cine deține fișierul, ce este permis să facă cu fișierul, unde se găsesc date și așa mai departe Inodele pentru fișiere sunt localizate fie secvențial la începutul discului, fie, dacă discul este împărțit în grupuri de cilindri, la începutul grupului Inodele sunt prevăzute cu numere consecutive Astfel, un sistem UNIX poate descoperi un i-node pur și simplu calculându-i adresa pe disc O intrare de director constă din două părți: un nume de fișier și un număr i-node Când programul execută următoarea comandă, sistemul caută în directorul curent al fișierului foo c pentru a găsi numărul inodul fișierului: openC'foo c", ) După ce a găsit numărul i-node, programul îl poate citi și afla toate informațiile despre fișier Dacă calea fișierului este mai lungă, procedura se repetă de mai multe ori până când întreaga cale a fost parcursă De exemplu, pentru a găsi numărul i-nodului pentru calea /usr/ast/data, sistemul va găsi mai întâi directorul rădăcină pentru elementul usr Odată ce găsește inodul usr, poate citi fișierul (directorul de pe sistem Exemple de sisteme de operare UNIX este, de asemenea, un fișier) În acest fișier, va căuta elementul ast și va găsi numărul i-node pentru fișierul /usr/ast Citind informațiile despre locație din directorul /usr/ast, sistemul va putea localiza intrarea pentru date și, prin urmare, numărul i-nodului pentru /usr/ast/data După ce a găsit numărul i-node pentru acest fișier, sistemul învață totul despre acest fișier Formatul, conținutul și plasarea inodurilor variază ușor de la sistem la sistem (mai ales când vine vorba de sistemele în rețea), dar următoarele elemente sunt prezente în aproape fiecare inod: ♦ tip de fișier, trei câmpuri RWX (total biți) și alți câțiva biți; ♦ numărul de legături cu fișierul (numărul de intrări în director); ♦ identificatorul proprietarului; ♦ grup de proprietari; ♦ lungimea fișierului în octeți; ♦ treisprezece adrese de disc; ♦ ora la care a fost citit ultima dată fișierul; ♦ ora la care a fost scris ultima dată dosarul; ♦ ora la care a fost schimbat ultima dată inodul Tipurile de fișiere pot fi diferite: fișiere obișnuite, directoare, două tipuri de fișiere speciale pentru dispozitive de I/O bloc și brute Am discutat deja despre numărul de link-uri și ID-ul proprietarului Lungimea fișierului este exprimată ca un număr întreg de de biți care indică cel mai semnificativ octet al fișierului Este perfect posibil să creați un fișier, să mutați indicatorul în poziția și să scrieți octet Rezultatul este un fișier cu o lungime de Cu toate acestea, acest fișier va necesita salvarea tuturor octeților "inexistenți" Primele adrese de pe disc indică blocuri de date Dacă dimensiunea blocului este de de octeți, atunci puteți lucra cu fișiere de până la de octeți Adresa AND indică un bloc indirect care conține de adrese de disc Aici puteți lucra cu fișiere de până la + x = octeți Pentru fișiere și mai mari, există adresa , care indică de blocuri indirecte Aici, dimensiunea permisă a fișierului este + x x = octeți Dacă această schemă de blocuri cu dublă indirectă este prea mică, se folosește adresa Ea indică blocul cu triplă indirectă, care conține adresele a de blocuri cu dublu indirectă Folosind adresarea directă, indirectă, dublă indirectă și triplă indirectă, pot fi accesate blocuri Aceasta înseamnă că dimensiunea maximă posibilă a fișierului este de de octeți Deoarece pointerii fișierelor sunt limitate la de biți, limita superioară reală a dimensiunii fișierului este de de octeți Blocurile de disc libere sunt stocate ca o listă legată Dacă este necesar un nou bloc, acesta este luat din listă Rezultatul este că blocurile fiecărui fișier sunt împrăștiate aleatoriu pe disc Pentru a îmbunătăți viteza I/O pe disc, trebuie să faceți următoarele După ce un fișier este deschis, inodul acestuia este copiat în tabelul principal Capitolul Stratul sistemului de operare memorie și este stocat acolo atâta timp cât fișierul rămâne deschis În plus, există un set de blocuri în memorie care au fost accesate recent Deoarece majoritatea fișierelor sunt citite secvențial, adesea un acces la fișier necesită același bloc ca și accesul anterior Pentru a crește viteza, sistemul citește următorul bloc într-un fișier chiar înainte de a fi accesat Toate aceste momente sunt ascunse utilizatorului Când utilizatorul face un apel pentru citire, programul se întrerupe până când datele solicitate sunt în buffer Știind toate acestea, puteți înțelege cum are loc procesul I/O Apelarea eagle face ca sistemul să caute directoare într-o anumită cale Dacă căutarea are succes, inodul este citit în tabelul intern Apelurile de citire și scriere necesită ca sistemul să calculeze numărul blocului din poziția curentă a fișierului Adresele primelor blocuri de disc sunt întotdeauna în memoria principală (inode); pentru blocurile rămase, trebuie mai întâi citite unul sau mai multe blocuri de adresare indirectă Apelul către Iseek schimbă pur și simplu poziția curentă a indicatorului și nu face I/O Primul argument pentru apelul de legătură este numărul inodului La acel număr, creează o intrare de director pentru al doilea argument și plasează numărul i-node al primului fișier în acea intrare de director În cele din urmă, crește numărul de legături din inod cu Apelarea dezlegarii elimină intrarea în director și reduce numărul de legături din inod Dacă acest număr devine , fișierul este șters și toate blocurile sale sunt plasate pe lista liberă I/O virtuală în Windows XP Windows XP acceptă mai multe sisteme de fișiere, dintre care cele mai importante sunt NTFS (NT File System) și FAT (File Allocation Table) Primul a fost conceput special pentru Windows XP Al doilea este un sistem de fișiere moștenit pentru MS-DOS, care este folosit și de Windows / (deși cu nume de fișiere lungi) Deoarece sistemul FAT este învechit, vom lua în considerare doar sistemul de fișiere NTFS Pe NTFS, un nume de fișier poate avea până la de caractere Numele fișierelor sunt scrise în Unicode, astfel încât persoanele din diferite țări care nu folosesc alfabetul latin să poată scrie numele fișierelor în propria lor limbă În toate versiunile sistemului de operare, începând cu Windows , textele meniurilor, mesajele de eroare și alte elemente ale interfeței sunt stocate în fișiere de configurare alocate pentru fiecare limbă, în timp ce fișierele binare sunt aceleași pentru toate variantele mediului de limbă Pe NTFS, literele mari și mici din numele fișierelor sunt considerate diferite (adică "foo" este diferit de "FOO") Din păcate, API-ul Win nu face distincție între literele majuscule și mici în numele fișierelor și directoarelor, astfel încât acest avantaj este pierdut pentru programele care utilizează subsistemul Win Ca și în UNIX, un fișier este o secvență liniară de octeți, a cărei lungime maximă este de - Există și pointerii, dar lungimea lor nu este de , ci de de biți, astfel încât să puteți suporta maximul Exemple de sisteme de operare lungimea fișierului Apelurile de funcții din API-ul Win pentru manipularea directoarelor și fișierelor sunt în general similare cu apelurile de funcții UNIX, dar cele mai multe dintre ele au mai mulți parametri și un model de securitate diferit Când fișierul este deschis, este returnat un handle, care este apoi folosit pentru a citi și scrie fișierul Spre deosebire de UNIX, descriptorii nu sunt numere întregi mici, iar intrarea standard, ieșirea standard și eroarea standard nu sunt definite în prealabil ca , și (excepția este modul consolă) Principalele funcții API Win pentru gestionarea fișierelor sunt enumerate în Tabelul (a doua coloană oferă funcția UNIX echivalentă) Tabelul Funcții de bază Win API pentru fișiere I/O Funcția API Funcția UNIX Descriere CreateFile open Creați un fișier sau deschideți un fișier existent; funcția returnează mânerul DeleteFile deconectare Șterge un fișier existent CloseHandle close Închide un fișier ReadFile read Citirea datelor dintr-un fișier WriteFile write Scrie date într-un fișier SetFilePointer Iseek Setați un indicator de fișier la o locație dată dintr-un fișier SetFileAttributes stat Returnează proprietățile fișierului LockFile Fcntl Blocați o regiune a unui fișier pentru a oferi excluderea reciprocă a accesului UnlockFile Fcntl Deblochează o zonă blocată anterior a unui fișier Să aruncăm o privire asupra acestor provocări Apelul CreateFile este folosit pentru a crea un fișier nou și le returnează un handle Această funcție este folosită și pentru a deschide un fișier deja existent, deoarece nu există nicio funcție heads în API Nu vom enumera parametrii funcțiilor API, deoarece există o mulțime de ei De exemplu, funcția CreateFile are șapte parametri: ♦ pointer către numele fișierului creat sau deschis; ♦ steaguri care indică ce acțiuni pot fi efectuate asupra fișierului (citire, scriere sau ambele); ♦ steaguri care indică dacă mai multe procese pot deschide un fișier în același timp; ♦ un pointer către un descriptor de securitate care indică cine are acces la fișier; ♦ steaguri care indică ce trebuie făcut când fișierul există și când nu există; ♦ steaguri asociate atributelor de arhivare, compresie etc ♦ handle de fișier ale cărui atribute urmează să fie clonate pentru noul fișier Următoarele șase funcții API sunt similare cu funcțiile UNIX corespunzătoare Ultimele două vă permit să blocați sau să deblocați o regiune a unui fișier pentru a vă asigura că procesele nu pot accesa aceeași regiune Capitolul Stratul sistemului de operare Folosind aceste funcții API, puteți scrie o procedură de copiere a fișierelor similară cu procedura din lista O astfel de procedură (fără codul de verificare a erorilor) este prezentată în Lista În practică, nu este nevoie să scrieți un program pentru a copia un fișier, deoarece există o funcție CopyFile care face aproximativ același lucru și este implementată ca procedură de bibliotecă Lista - Un fragment de program pentru copierea unui fișier folosind funcția API a sistemului Windows XP Acest fragment este scris în C, deoarece Java nu poate afișa apelurile de sistem de nivel scăzut de care avem nevoie /* Deschide fișierele pentru intrare și ieșire */ Inhandle = CreateFIleC'data" GENERIC READ, Oh, NULL OPEN EXISTING, NULL); outhandle = CreateFileC'newF, GENERIC WRITE, , NULL, CREATE ALWAYS, FILE ATTRIBUTE NORMAL, NULL); /* Copiați fișierul */ face { s = ReadFilednhandle, buffer, BUF SIZE, &count, NULL); Dacă (s > && count > ) WriteF e(outhandle, buffer, count, &ocnt, NULL); } while (s > && count > ); /* Închiderea fișierelor */ CIoseHandle(inhandle); CloseHandle (mâner exterior); Windows XP acceptă un sistem de fișiere ierarhic similar cu sistemul de fișiere UNIX Cu toate acestea, separatorul de aici nu este o bară oblică înainte, ci o bară oblică inversă (împrumutat de la MS-DOS) Și aici există conceptul de director curent, iar căile pot fi absolute și relative Cu toate acestea, există o diferență semnificativă între Windows XP și UNIX UNIX vă permite să montați sisteme de fișiere de pe diferite discuri și mașini într-un singur arbore, ascunzând astfel structura discului de programe Windows XP nu are această capacitate, așa că numele absolute de fișiere trebuie să înceapă cu o literă de unitate (de exemplu, C:\windows\system\foo dll) În același timp, capacitatea de a monta sisteme de fișiere în stil UNIX a fost introdusă în Windows Principalele funcții pentru lucrul cu directoare sunt listate în Tabel (de asemenea, împreună cu echivalentele UNIX) Tabelul Funcțiile de bază ale Win API pentru lucrul cu directoare Funcția API Funcția UNIX Semnificație CreateDirectiry mkdir Creați un director nou RemoveDirectory rmdir Eliminați un director gol FindFirstFile opendir Începeți să citiți intrările din director FindNextFile readdir Citiți următoarea intrare dintr-un director MoveFile Mută un fișier dintr-un director în altul SetCurrentDirectory chdir Schimba directorul curent Windows XP are un mecanism de securitate mai sofisticat decât UNIX Când un utilizator se conectează, procesul său primește un token de acces de la sistemul de operare Exemple de sisteme de operare sistemul noah Indicatorul de acces conține un identificator de securitate (ID de securitate, SID), o listă de grupuri din care aparține utilizatorul, privilegii disponibile și alte informații Tokenul de acces concentrează toate informațiile de securitate într-un singur loc ușor accesibil Toate procesele create de acest proces moștenesc același simbol de acces Un descriptor de securitate este unul dintre parametrii dați oricărui obiect atunci când este creat Descriptorul de securitate conține o listă de elemente numită Listă de control al accesului (ACL) Fiecare element permite sau interzice un anumit set de operațiuni cu obiectul oricărui utilizator sau grup De exemplu, un fișier poate conține un descriptor de securitate care specifică că Ivanov nu are deloc acces la fișier, Petrov poate citi fișierul, Sidorov poate citi și scrie fișierul și toți membrii grupului XYZ pot citi doar dimensiunea de fișierul Dacă un proces încearcă să efectueze orice operațiune asupra unui obiect folosind mânerul primit la deschiderea obiectului, managerul de securitate obține jetonul de acces al procesului și începe să repete ACL în ordine De îndată ce găsește un element care se potrivește utilizatorului dorit sau unuia dintre grupuri, informațiile găsite despre permiterea sau refuzarea accesului sunt considerate ca date Din acest motiv, elementele care interzic accesul sunt de obicei plasate în lista de control al accesului înaintea elementelor care permit accesul (astfel încât un utilizator care nu are acces să nu poată obține acces ilegal fiind membru al unuia dintre grupurile cărora li se permite accesul) Descriptorul de securitate conține, de asemenea, informații utilizate pentru auditarea acceselor la obiect Acum să vedem cum sunt implementate fișierele și directoarele în Windows XP Fiecare disc este împărțit în volume, la fel ca și partițiile de disc UNIX Fiecare volum conține fișiere, hărți de biți de director și alte structuri de date Fiecare volum este organizat ca o secvență liniară de clustere Mărimea clusterului este fixă pentru fiecare volum Poate fi de la octeți la KB, în funcție de dimensiunea volumului Clusterul este accesat prin offset de la începutul volumului Aceasta utilizează numere pe de biți Structura principală de date din fiecare volum este Master File Table (MFT), care conține intrări pentru fiecare fișier și director din volum Aceste intrări sunt similare cu intrările inode (i-node) în UNIX Tabelul de fișiere master este un fișier și poate fi plasat oriunde într-un volum Aceasta rezolvă o problemă care apare atunci când se găsesc blocuri de disc proaste printre inoduri Tabelul principal al fișierelor este prezentat în fig Începe cu un antet care oferă informații despre volum (indicatori către directorul rădăcină, fișierul de descărcare, lista utilizatorilor gratuiti etc ) Apoi, există o intrare per fișier sau director ( KB dacă dimensiunea clusterului este de KB sau mai mult) Fiecare element conține toate metadatele (informații administrative) despre un fișier sau director Sunt permise mai multe formate, dintre care unul este prezentat în Fig Capitolul Stratul sistemului de operare Tabelul Master File (MFT) Orez Tabel de fișiere master în Windows XP Câmpul de informații standard conține informații despre marcajele de timp cerute de standardele POSIX, numărul de legături, biți de doar citire, biți de arhivare etc Acest câmp are o lungime fixă și este obligatoriu Numele fișierului poate avea orice lungime, până la de caractere Unicode Pentru a face astfel de fișiere accesibile pentru programele moștenite pe biți, li se poate atribui un alias MS-DOS de până la caractere, urmat de un punct și o extensie de caractere Dacă numele propriu-zis al fișierului urmează convenția de denumire MS-DOS ( + ), numele de mijloc în stil MS-DOS nu este utilizat Urmează domeniul de securitate În toate versiunile anterioare Windows NT , câmpul de securitate conținea un descriptor de securitate Începând cu Windows , toate informațiile de securitate sunt plasate într-un singur fișier, iar câmpul de securitate indică pur și simplu partea corespunzătoare a acelui fișier Pentru fișierele mici, datele reale ale acelor fișiere pot fi conținute într-o intrare de tabel de fișiere master, făcându-le mai ușor de apelat fără a necesita acces la disc Acest concept se numește fișierul imediat [ ] Pentru fișierele mari, acest câmp conține pointeri către grupuri de date sau (mai frecvent) blocuri de clustere consecutive, astfel încât numărul și lungimea clusterului pot reprezenta o cantitate arbitrară de date Dacă elementul tabelului de fișiere principal nu este suficient de mare pentru a stoca informațiile necesare, unul sau mai multe elemente suplimentare (înregistrări) îi pot fi asociate Dimensiunea maximă a fișierului este de de octeți Să explicăm ce este un fișier de această dimensiune Să ne imaginăm că fișierul este scris în sistem binar și fiecare sau ocupă mm de spațiu Valoarea de mm corespunde unei valori de ani lumină Acest lucru ar fi suficient pentru a trece dincolo de sistemul solar, a ajunge la Alpha Centauri și a reveni înapoi Sistemul de fișiere NTFS are multe alte caracteristici interesante, în special, acceptă comprimarea datelor și mecanismul de toleranță la erori bazat pe tranzacții atomice Informații suplimentare pot fi găsite în [ ] Exemple de sisteme de operare Exemple de control al procesului Sistemele Windows XP și UNIX permit ca munca să fie împărțită în mai multe procese care rulează în paralel și interacționează între ele, ca în exemplul producător/consumator despre care am discutat mai devreme În această subsecțiune, vom vorbi despre modul în care procesele sunt gestionate în ambele sisteme Ambele sisteme suportă paralelismul într-un singur proces folosind fire de execuție de program și vom vorbi și despre asta Managementul proceselor în UNIX În orice moment, un proces UNIX poate crea un subproces care este copia lui exactă Acest lucru se face folosind apelul de sistem fork Procesul inițial se numește părinte, iar cel nou se numește copil Cele două procese rezultate din apelul fork sunt exact identice și chiar împărtășesc aceiași descriptori de fișier Cu toate acestea, fiecare dintre aceste două procese își desfășoară activitatea independent de celălalt Adesea, procesul copil direcționează greșit descriptorii fișierelor într-un fel și apoi execută apelul de sistem exec, care înlocuiește programul și datele cu programul și datele din fișierul executabil specificat ca parametru pentru apelul exec De exemplu, dacă utilizatorul introduce comanda xyz, atunci interpretul de comandă (shell) efectuează o operație de furcăre, generând astfel un proces copil Și acest proces face un apel către exec pentru a rula programul xyz Aceste două procese rulează în paralel (cu sau fără apelul de sistem exec), dar uneori procesul părinte trebuie, dintr-un motiv oarecare, să aștepte ca procesul copil să-și termine activitatea înainte de a continua să facă ceva În acest caz, procesul părinte emite un apel de sistem wait sau waitpid, determinând suspendarea temporară și așteptarea până când procesul secundar emite apelul de sistem de ieșire Procesele se pot bifurca ori de câte ori doresc, rezultând un întreg arbore de proces Uită-te la fig Aici, procesul A s-a bifurcat de două ori și a generat două procese noi, B și C Apoi, procesul B s-a bifurcat de două ori și procesul C o dată Astfel, s-a obținut un arbore de șase procese Procesul sursă Procesele generate de procesul A Procese generate de procesele copil ale procesului A Orez Arborele de proces în sistemul UNIX Procesele din UNIX pot comunica între ele printr-o structură specială de informații numită conductă Canalul prezintă Capitolul Stratul sistemului de operare este un fel de buffer în care un proces scrie un flux de date, iar un alt proces preia aceste date de acolo Octeții sunt întotdeauna returnați de la canal în ordinea în care au fost scrisi Accesul aleatoriu nu este posibil Canalele nu păstrează granițele dintre fragmentele de date, așa că dacă un proces a scris fragmente de de octeți pe canal, iar un alt proces citește date de de octeți, atunci al doilea proces va primi toate datele simultan fără a indica faptul că au fost scrise în câțiva pași System V și Solaris folosesc o metodă diferită pentru comunicarea proceselor Aici sunt folosite așa-numitele cozi de mesaje Un proces poate crea o nouă coadă de mesaje sau poate deschide una existentă apelând msgget Mesajele sunt trimise folosind msgsnd și primite folosind msgrecv Mesajele trimise în acest fel sunt diferite de datele introduse într-un canal În primul rând, limitele mesajelor sunt păstrate în timp ce canalul pur și simplu transmite fluxul de date În al doilea rând, mesajele sunt prioritizate, așa că mesajele urgente vin înaintea tuturor celorlalte În al treilea rând, mesajele sunt tastate, iar apelarea msgrecv vă permite să determinați tipul lor, dacă este necesar Două sau mai multe procese pot împărtăși o zonă comună a spațiilor lor de adrese UNIX gestionează această memorie partajată prin maparea acelorași pagini la spațiul de adrese virtuale al tuturor proceselor partajate Ca rezultat, o scriere în zona partajată făcută de unul dintre procese va fi vizibilă pentru toate celelalte procese Acest mecanism oferă un debit foarte mare atunci când procesele interacționează O altă caracteristică a System V și Solaris este prezența semaforelor Am descris deja principiile muncii lor când am vorbit despre producător și consumator Sistemele UNIX pot suporta mai multe fire de control într-un singur proces Aceste fluxuri de control sunt de obicei denumite pur și simplu fluxuri de program Sunt ca procesele care partajează un spațiu de adrese comun și toate obiectele asociate cu acel spațiu de adrese (descriptori de fișiere, variabile de mediu etc ) Cu toate acestea, fiecare fir de execuție are propriul său numărător de programe, propriile registre și propriul său stack Dacă unul dintre firele de execuție a programului este suspendat (de exemplu, până la finalizarea unui proces I/O), alte fire de execuție a programului din același proces pot continua să ruleze Două fire de execuție de program din același proces care acționează ca un proces producător și un proces consumator seamănă cu două procese cu un singur thread care împart un segment de memorie care conține un buffer, deși nu sunt identice În al doilea caz, fiecare proces are propriii descriptori de fișier etc , în timp ce în primul caz, toate aceste elemente sunt comune În exemplul producător-consumator, am văzut cum funcționează firele în Java Uneori, sistemul de rulare Java folosește un fir de execuție al sistemului de operare pentru a suporta fiecare dintre fire, dar acest lucru nu este necesar Când ai putea avea nevoie de fire de execuție de program? Luați în considerare un server web Un astfel de server poate stoca un cache de pagini web accesate frecvent în memoria principală Dacă pagina dorită se află în cache, atunci aceasta este emisă imediat Dacă nu, este apelat de pe disc Din păcate, acest lucru durează destul de mult (de obicei de milisecunde), pentru acest timp Exemple de sisteme de operare procesul este blocat și nu poate servi cereri noi, chiar dacă paginile web solicitate sunt în cache Pentru a rezolva problema, puteți crea mai multe fire în același proces care partajează un cache comun al paginii web Dacă unul dintre firele de execuție a programului este blocat, cererile noi pot fi procesate de alte fire de execuție a programului De asemenea, puteți preveni blocarea procesului fără a utiliza fire Acest lucru va necesita mai multe procese, dar apoi va trebui să duplicați memoria cache, ceea ce este oarecum risipitor, deoarece memoria este limitată Standardul de sistem UNIX pentru firele de execuție se numește pthreads și este definit în POSIX (P C) Descrie apeluri pentru gestionarea și sincronizarea firelor de execuție a programului Standardul nu spune dacă firele de execuție ar trebui gestionate de kernel sau ar trebui să funcționeze numai în spațiul utilizatorului Cele mai comune funcții pentru lucrul cu firele de execuție ale programului sunt prezentate în tabel Tabelul - Funcții de bază pentru lucrul cu firele de execuție definite în standardul POSIX Descrierea funcției pthread create Creați un nou thread de program în spațiul de adrese al procedurii de apelare pthread exit Închide un fir de execuție al unui program pthreadjoin Așteptați ca un fir de program să se termine pthread mutex init Creați un nou mutex pthread mutex destroy Eliminarea unui mutex pth read m utex l oc k Blocare mutex pthread mutex unlock Deblochează un mutex pthread-CondJnit Crearea unei variabile de condiție pthread cond destroy Ștergerea unei variabile de condiție pthread cond wait Așteptați o variabilă de condiție pthread cond signal Deblocați unul dintre firele de execuție care așteaptă o variabilă de condiție Să aruncăm o privire asupra acestor provocări Primul apel, pthreadcreate, creează un nou thread de program După executarea acestei proceduri, în spațiul de adrese mai apare un fir de program Firul programului care și-a făcut treaba apelează funcția pthreadexit Dacă un thread trebuie să aștepte ca un alt thread să se termine, apelează funcția pthreadjoin Dacă celălalt thread și-a terminat deja lucrul, apelul la pthread join se încheie imediat În caz contrar, este blocat Firele de execuție ale programului pot fi sincronizate folosind obiecte speciale numite mutex De obicei, un mutex controlează un fel de resursă (de exemplu, un buffer partajat între două fire de execuție a programului) Pentru a vă asigura că numai un fir de execuție poate accesa o resursă partajată la un moment dat, firele de execuție trebuie să blocheze mutex-ul înainte de a utiliza resursa și să o deblocheze când au terminat Capitolul Stratul sistemului de operare lucra cu el În acest fel, condițiile de cursă pot fi evitate, deoarece toate firele de execuție se supun acestui protocol Mutexurile sunt similare cu semaforele binare (adică semaforele care pot lua doar două valori: sau ) Mutexurile pot fi create și distruse prin apeluri la pthreadmutexinit și, respectiv, pthreadmutexdestroy Un mutex poate fi în una din două stări: blocat sau deblocat Dacă un fir de execuție trebuie să blocheze un mutex deblocat, efectuează un apel către pthread mutexlock și apoi continuă Totuși, dacă un fir de execuție încearcă să blocheze un mutex deja blocat, firul de execuție este suspendat Când firul de execuție care utilizează în prezent resursa partajată a terminat de utilizat acea resursă, trebuie să deblocheze mutex-ul corespunzător apelând pthreadmutexunl ock Mutexurile sunt concepute pentru blocarea pe termen scurt (de exemplu, protejarea unei variabile partajate), dar nu pentru sincronizare pe termen lung (de exemplu, așteptarea ca o unitate de bandă să devină liberă) Pentru sincronizarea pe termen lung, există variabile de condiție Aceste variabile sunt create și șterse prin apeluri către pthreadcondinit și, respectiv, pthreadconddestroy O variabilă de condiție este asociată cu două fire de program: așteptare și semnalizare Dacă, de exemplu, un fir detectează că unitatea de bandă de care are nevoie este ocupată în prezent, acel fir emite un apel către pthreadcondwait pe variabila condiție Când un fir care folosește o unitate de bandă își încheie lucrul cu acest dispozitiv (și poate dura câteva ore), acesta semnalează acest lucru apelând pthreadcondsignal Acest lucru permite deblocarea exact unui fir - cel care așteaptă această variabilă de condiție Dacă nu există fire care să aștepte această variabilă, semnalul dispare Variabilele de condiție nu au un numărător, așa cum au semaforele Rețineți că alte operațiuni pot fi efectuate pe fire, mutex și variabile de condiție Managementul proceselor în Windows XP Windows XP acceptă mai multe procese care pot interacționa și sincroniza Fiecare proces conține cel puțin un fir de program, care, la rândul său, conține cel puțin un fir ușor, sau fibră Procesele, firele și fibrele sunt instrumente colective pentru menținerea concurenței în sistemele cu un singur procesor și multiprocesor Procesele noi sunt create folosind funcția CreateProcess API Această funcție are argumente, fiecare cu mai mulți parametri Evident, un astfel de sistem este mult mai complicat decât schema UNIX corespunzătoare, unde funcția fork nu are deloc argumente, iar exec are doar trei dintre ele: pointeri către numele fișierului executabil, către o serie de opțiuni ale liniei de comandă, și la o linie de descriere a configurației Cele argumente ale funcției CreateProcess sunt enumerate mai jos: ♦ pointer către numele fișierului executabil; ♦ linia de comandă propriu-zisă (fără parsing); + pointer către descriptorul de securitate al acestui proces; Exemple de sisteme de operare + pointer către descriptorul de securitate al firului original al programului; + un pic care spune dacă noul proces moștenește mânerele de proces ale părintelui; + diverse steaguri (de ex erori, prioritate, depanare, console); + pointer către liniile de descriere a configurației; + pointer către numele directorului de lucru al noului proces; + un pointer către o structură care descrie fereastra sursă de pe ecran; + pointer către o structură care returnează valori la procedura de apelare În Windows XP, nu există o ierarhie a proceselor părinte-copil Toate procesele sunt create egale Cu toate acestea, deoarece unul dintre cei parametri returnați la procesul inițial este mânerul noului proces (care permite controlul noului proces), există o ierarhie internă în sensul că anumite procese conțin mânere către alte procese Aceste mânere nu pot fi pur și simplu trecute direct către alte procese, dar un proces poate face un anumit mâner disponibil altui proces și apoi să îi transmită acel mâner, astfel încât ierarhia internă a procesului să nu poată persista mult timp Fiecare proces din Windows XP este creat cu un singur thread, dar procesul poate crea ulterior mai multe fire Crearea unui fir de execuție de program este mai ușoară decât crearea unui proces, deoarece apelul CreateThread are doar parametri în loc de : descriptor de securitate, dimensiunea stivei, adresa de pornire, parametrul utilizatorului, starea inițială a firului (gata sau blocată) și ID-ul firului Deoarece nucleul este responsabil pentru crearea firelor de execuție, are informații despre toate firele de execuție a programului (cu alte cuvinte, implementarea lor nu se limitează la spațiul utilizatorului, ca în alte sisteme) Când nucleul efectuează o sincronizare, apelează nu numai procesul care ar trebui să ruleze în continuare, ci și firul de execuție al procesului respectiv Aceasta înseamnă că nucleul știe întotdeauna ce fire de execuție de program sunt blocate și care nu Deoarece firele de execuție sunt obiecte kernel, au descriptori și mânere de securitate Deoarece descriptorilor li se permite să fie transmise unui alt proces, este posibil ca un proces să gestioneze fluxurile de program ale altui proces Această caracteristică poate fi necesară, de exemplu, pentru depanatoare Crearea de fire de execuție în Windows XP este destul de irosită, deoarece necesită să introduceți nucleul și apoi să îl ieșiți Pentru a evita acest lucru, Windows XP furnizează fibre, care sunt similare cu firele de execuție ale programului, dar rulate și sincronizate în spațiul utilizatorului de către programul care le creează Fiecare fir poate avea mai multe fibre, la fel ca un proces poate avea mai multe fire, doar in acest caz, cand o fibra este blocata, aceasta intra in coada de fibre blocate si alege alta fibra care sa ruleze pe firul ei Nucleul nu știe despre această tranziție, deoarece firul continuă să ruleze, chiar dacă mai întâi a rulat o fibră și apoi alta Capitolul Stratul sistemului de operare Nucleul gestionează procesele și firele de execuție, dar nu gestionează fibrele Fibrele pot fi utile, de exemplu, atunci când programele care au fire proprii sunt portate în Windows XP Procesele pot comunica între ele în mai multe moduri: prin conducte, conducte numite, sloturi de e-mail, socketuri, apeluri de procedură la distanță, fișiere partajate Există două tipuri de canale: octeți și mesaje Tipul este selectat în momentul creării Byte pipes funcționează la fel ca în UNIX Canalele de mesaje păstrează limitele mesajelor, astfel încât patru înregistrări de de octeți sunt citite de pe canal ca patru mesaje de de octeți (mai degrabă decât un mesaj de de octeți, așa cum este cazul canalelor de octeți) În plus, există țevi numite, care vin și în două soiuri Conductele denumite pot fi utilizate în rețea, dar conductele normale nu Sloturile de e-mail (mailslot) sunt un atribut exclusiv al Windows XP (nu există niciunul în UNIX) Sunt asemănătoare canalelor în multe privințe, deși nu în toate privințele În primul rând, sunt unilaterale, iar canalele sunt cu două fețe Pot fi folosite online, dar nu garantează livrarea În cele din urmă, acceptă difuzarea mesajelor către mai mulți destinatari, nu doar către unul singur Prizele sunt similare cu țevile, dar de obicei conectează procese pe mașini diferite, deși pot fi folosite și pentru a conecta procese pe aceeași mașină În general, o conexiune priză nu este cu mult mai bună decât o conexiune obișnuită sau numită Apelurile de procedură de la distanță permit procesului A să instruiască procesul B să efectueze un apel de procedură în spațiul de adrese B în numele lui A și să returneze rezultatul procesului A Există diverse restricții privind parametrii apelului De exemplu, trecerea unui pointer către un alt proces nu are niciun sens În cele din urmă, procesele pot partaja memoria partajată prin maparea simultană a aceluiași fișier în memorie Apoi, toate înregistrările generate de un proces vor apărea în spațiul de adrese al altor procese Folosind acest mecanism, se poate implementa cu ușurință un buffer partajat (partajat), pe care l-am descris în exemplu cu procesul producător și procesul consumator Windows XP oferă multe mecanisme de sincronizare (semafore, mutexuri, secțiuni critice, evenimente) Toate aceste mecanisme nu funcționează cu procese, ci cu fire de execuție de program, așa că atunci când un fir de execuție se blochează pe un semafor, nu afectează în niciun fel alte fire de execuție ale acestui proces - ele continuă să funcționeze Un semafor este creat folosind funcția CreateSemaphore API, care îl poate seta la o anumită valoare și poate determina valoarea maximă a acestuia Semaforele sunt obiecte kernel, deci au descriptori de securitate și mânere Un mâner de semafor poate fi duplicat folosind funcția DuplicateHandle și transmis unui alt proces, astfel încât un singur semafor poate sincroniza mai multe procese Sunt acceptate și funcțiile sus și jos, deși au denumiri diferite: ReleaseSemaphore (pentru sus) și WaitForSingleObject (pentru jos) Puteți defini o limită de timp inactiv pentru funcția WaitForSingleObject, astfel încât firul apelant să poată fi deblocat în cele din urmă chiar dacă semaforul rămâne la (cu toate acestea, cronometrele contribuie la condițiile de cursă) Rezumatul capitolului Mutexurile sunt, de asemenea, obiecte nucleu, dar sunt mai simple decât semaforele deoarece nu au contor Sunt, de fapt, obiecte cu funcții API pentru blocare (WaitForSingleObject) și deblocare (ReleaseMutex) Mânerele Mutex, precum mânerele semaforului, pot fi duplicate și transmise altor procese, astfel încât firele din procese diferite să poată accesa același mutex Al treilea mecanism de sincronizare se bazează pe secțiuni critice Secțiunile critice sunt similare cu mutexurile, cu excepția localității lor în ceea ce privește spațiul de adresă al firului de execuție original al programului Deoarece secțiunile critice nu sunt obiecte kernel, ele nu au mânere sau descriptori de securitate, deci nu pot fi transmise altor procese Blocarea și deblocarea se realizează folosind funcțiile EnterCriticalSection și, respectiv, LeaveCriticalSection Deoarece aceste funcții API rulează în întregime în spațiul utilizatorului, sunt mult mai rapide decât mutexurile Ultimul mecanism este legat de utilizarea obiectelor kernel, care se numesc evenimente Dacă un fir trebuie să aștepte un eveniment, apelează WaitForSingleObject Puteți folosi funcția SetEvent pentru a debloca un fir în așteptare și puteți folosi funcția PulseEvent pentru a debloca toate firele în așteptare Există mai multe tipuri de evenimente care au mai mulți parametri Evenimentele, mutexurile și semaforele pot fi denumite în mod specific și stocate în sistemul de fișiere ca conducte numite Puteți sincroniza activitatea a două sau mai multe procese prin deschiderea aceluiași eveniment, mutex sau semafor În acest caz, nu trebuie să creeze un obiect și apoi să dubleze mânerele, deși această abordare este, de asemenea, posibilă Rezumatul capitolului Sistemul de operare poate fi gândit ca un interpret pentru anumite caracteristici arhitecturale care nu există la nivelul arhitecturii de instrucțiuni Principalele dintre acestea sunt memoria virtuală, instrucțiunile I/O virtuale și suportul de concurență Memoria virtuală este necesară pentru a permite programelor să utilizeze mai mult spațiu de adrese decât are mașina de fapt sau pentru a oferi un mecanism convenabil pentru protejarea și partajarea memoriei Memoria virtuală poate fi implementată prin paginare "pură", segmentare "pură" sau ambele Cu memoria de paginare, spațiul de adrese este împărțit în pagini virtuale de dimensiuni egale Unele dintre ele sunt mapate pe cadre de pagină fizice, altele nu Referința la pagina mapată este tradusă de managerul de memorie în adresa fizică corectă Accesarea unei pagini nemapate cauzează o eroare de ieşire a paginii Pentium și UltraSPARC III au manageri de memorie sofisticați care acceptă memoria virtuală și paginarea Cea mai importantă abstractizare I/O la acest nivel este fișierul Un fișier constă dintr-o secvență de octeți, sau înregistrări logice, care pot fi Capitolul Stratul sistemului de operare citiți și scrieți fără a ști cum funcționează discurile și alte dispozitive I/O Fișierele pot fi accesate secvențial, non-secvențial după numărul de înregistrare și non-secvențial prin tastă Directoarele sunt folosite pentru a grupa fișiere Fișierele pot fi stocate în sectoare consecutive sau pot fi împrăștiate pe disc În acest din urmă caz, sunt necesare structuri speciale de date pentru a găsi toate blocurile din fișier Puteți utiliza o listă de goluri (zone neutilizate) sau un bitmap (bitmap) pentru a urmări spațiul liber de pe un disc Paralelismul este adesea susținut și implementat în sistemele uniprocesor prin partajarea timpului, care este modul în care sunt modelate procesoarele multiple Interacțiunea necontrolată a diferitelor procese poate duce la o condiție de rasă Pentru a le evita, sunt introduse mijloace speciale de sincronizare Cele mai simple dintre acestea sunt semaforele UNIX și Windows XP sunt sisteme de operare complexe Ambele sisteme acceptă paginarea și maparea memoriei fișierelor În plus, acceptă sisteme de fișiere ierarhice, în care fișierele sunt alcătuite dintr-o secvență de octeți În cele din urmă, ambele sisteme suportă procese și fire și oferă mecanisme pentru sincronizarea acestora Întrebări și sarcini De ce sistemul de operare interpretează doar unele dintre comenzile de nivelul (vezi Figura ), în timp ce firmware-ul interpretează toate comenzile de la nivelul arhitecturii instrucțiunilor? Mașina conține un spațiu de adrese virtuale de de biți adresat de octeți Dimensiunea paginii este de KB Câte pagini de spațiu de adrese virtuale există? Ar trebui ca dimensiunea paginii să fie o putere de doi? Este teoretic posibil să se implementeze o pagină de, să zicem, de octeți? Dacă da, cât de mult este justificată această dimensiune? Memoria virtuală conține pagini virtuale și cadre de pagină fizice Dimensiunea paginii este de de cuvinte Tabelul de pagini corespunzător arată ca Tabel Tabelul Tabel de pagini pentru job Pagina virtuală Cadru de pagină unsprezece Nu se află în memoria principală Nu se află în memoria principală Nu în memoria principală Nu în memoria principală Întrebări și sarcini ) Creați o listă de adrese virtuale care vor cauza o eroare a paginii atunci când sunt accesate ) Care sunt adresele fizice pentru adresele virtuale , , , , , și ? Computerul are pagini de spațiu de adrese virtuale și doar cadre de pagină Inițial, memoria este goală Programul accesează paginile virtuale în următoarea ordine: , , , , , , , , ) Care dintre apelurile algoritmului LRU va cauza o eroare a paginii? ) Care dintre accesările FIFO va cauza o eroare a paginii? În subsecțiunea "Politica de înlocuire a paginii" a secțiunii "Memorie virtuală", a fost propus un algoritm de înlocuire a paginii FIFO Dezvoltați un algoritm mai eficient Sfat', puteți actualiza contorul în pagina nou încărcată, lăsând toate celelalte În sistemele de paginare pe care le-am discutat în acest capitol, gestionarea erorilor de pagină a făcut parte din stratul arhitecturii de instrucțiuni și, prin urmare, nu este prezent în spațiul de adrese al sistemului de operare În practică, un astfel de handler ocupă unele pagini și poate fi eliminat în anumite circumstanțe (de exemplu, în conformitate cu politica de înlocuire a paginii) Ce s-ar întâmpla dacă gestionarea erorilor nu era disponibilă în momentul în care a apărut eroarea? Cum se rezolvă această problemă? Nu toate computerele conțin un bit special care este setat automat atunci când o pagină este scrisă Cu toate acestea, trebuie să urmăriți cumva paginile modificate, astfel încât să nu fie nevoie să scrieți toate paginile înapoi pe disc după ce le utilizați Presupunând că fiecare pagină are biți speciali pentru permisiuni de citire, scriere și executare, cum poate sistemul de operare să țină evidența paginilor care s-au schimbat și care nu? Memoria segmentată conține segmente de pagină Fiecare adresă virtuală conține un număr de segment de biți, un număr de pagină de biți și un offset de biți AND în cadrul paginii Memoria principală conține KB, care sunt împărțite în pagini de KB Fiecare segment poate fi doar citire, citire și execuție, citire-scriere sau citire-scriere-executare Tabelele de pagini și variantele de protecție sunt rezultate în tab Calculați adresa fizică pentru fiecare dintre cele enumerate în tabel opțiuni pentru accesarea memoriei virtuale Dacă apare o eroare, indicați ce tip este Unele computere permit I/O direct în spațiul utilizatorului De exemplu, un program poate începe să transfere date de pe disc pe un buffer în interiorul unui proces utilizator Va cauza acest lucru probleme dacă compactarea este utilizată pentru a implementa memoria virtuală? Argument Capitolul Stratul sistemului de operare Tabelul Tabelele de pagini pentru job Segmentul Segmentul Segmentul Segmentul Numai citire Citire și executare Citire, Citire și scriere Pagina virtuală Cadru de pagină Pagina virtuală Cadru de pagină Înregistrare și execuție Pagina virtuală Cadru de pagină Pe disc Nici un tabel de pagini în memoria principală Tabelul de pagini nu este în memoria principală Pe disc Tabelul de pagini nu este în memoria principală Tabelul de pagini nu este în memoria principală Pe disc Tabelul Opțiuni pentru accesarea memoriei virtuale pentru job Accesați Segment Page Offset în cadrul paginii Apel de date Apel de date Apel de date Salvați datele Salvați datele Salvați datele Tranziția Apel de date Apel de date Tranziție I Sistemele de operare care pot utiliza fișiere mapate în memorie necesită întotdeauna afișarea fișierelor în limitele paginii De exemplu, dacă avem pagini de K, fișierul poate fi redat începând de la adresa virtuală și nu de la adresa virtuală De ce este necesar acest lucru? La încărcarea unui registru de segment în Pentium , este apelat descriptorul corespunzător, care este încărcat în partea invizibilă a registrului de segment De ce crezi că dezvoltatorii Intel au decis să facă asta? Un program de pe un computer Pentium accesează segmentul local la offset Câmpul BAZ al segmentului din tabelul descriptor local conține numărul Ce intrare în tabelul de pagini folosește Pentium ? Care este numărul paginii? Care este compensarea? Luați în considerare posibili algoritmi pentru ștergerea segmentelor din memoria segmentată nepaginată Întrebări și sarcini Comparați fragmentarea internă cu fragmentarea externă Ce se poate face pentru a evita fiecare dintre ele? Supermarketurile se confruntă adesea cu o problemă similară cu mecanismul de înlocuire a paginilor din sistemele de memorie virtuală Supermarketurile au o zonă fixă de spațiu pe rafturi unde trebuie plasate tot mai multe articole Dacă sosește un produs nou important, cum ar fi hrana pentru câini de foarte înaltă calitate, un alt produs trebuie îndepărtat pentru a face loc noului produs Cunoaștem doi algoritmi: LRU și FIFO Pe care il preferi? Într-un fel, tehnologiile de stocare în cache și de paginare în memorie sunt similare între ele În ambele cazuri, memoria este împărțită în două regiuni (cache și memoria principală într-un caz și memoria principală și pe disc în celălalt) Textul din acest capitol argumentează atât pentru dimensiunile de pagină mari, cât și pentru cele mici Sunt aceste argumente valide pentru dimensiunile liniei de cache? De ce multe sisteme de fișiere necesită ca un fișier să fie deschis în mod explicit de apelul de sistem Eagle înainte de a fi citit? Comparați utilizarea unui bitmap și a unei liste de goluri pentru a ține evidența spațiului liber de pe un disc Discul este format din de cilindri, fiecare având piste de de sectoare Câte goluri (fragmente neutilizate) vor fi necesare pentru ca lista lor să fie mai mare decât bitmap-ul? Se presupune că blocul de alocare este un sector și sunt necesari de biți pentru a stoca informații despre fiecare fragment neutilizat din lista nulă Pentru a face predicții despre performanța discului, trebuie să aveți un model de alocare a memoriei Să presupunem că discul este văzut ca un spațiu de adrese liniar de N sectoare (W " ) Aici, mai întâi există o secvență de blocuri de date, apoi spațiu neutilizat, apoi o altă secvență de blocuri de date și așa mai departe numărul de goluri pe disc? Pe o anumită mașină, un program poate crea câte fișiere are nevoie și toate fișierele pot crește în dimensiune în timp ce programul rulează, fără ca sistemul de operare să primească informații suplimentare despre dimensiunea lor finală Crezi că fișierele vor fi stocate în sectoare consecutive? Explica Potrivit unui studiu al diferitelor sisteme de fișiere, mai mult de jumătate dintre fișiere ocupă mai puțin de câțiva kiloocteți de spațiu pe disc, marea majoritate fiind mai puțin de KB Pe de altă parte, % (cantitativ) din toate fișierele ocupă de obicei mai mult de % din spațiul pe disc utilizat Ce concluzie despre dimensiunea blocurilor de disc se poate trage din aceste date? Luați în considerare una dintre metodele de implementare a comenzilor pentru lucrul cu semafoare Ori de câte ori CPU este pe cale să execute o comandă sus sau jos pe un semafor (un semafor este o variabilă întreagă în memorie), Capitolul Stratul sistemului de operare mai întâi setează prioritatea CPU în așa fel încât să blocheze toate întreruperile Apoi apelează semaforul din memorie, îl modifică și sare în funcție de valoarea lui După aceea, reactivează întreruperile Va funcționa această metodă dacă: ) Există un singur procesor care comută între procese la fiecare de milisecunde? ) cele două procesoare au o memorie comună unde se află semaforul? O companie de sistem de operare primește plângeri de la clienții săi cu privire la cea mai recentă dezvoltare care acceptă operațiunile cu semafor Clienții au decis că este imoral ca procesele să-și suspende munca (adică somnul la locul de muncă) Pentru a-și mulțumi clienții, compania a decis să adauge o a treia operațiune, rack Această operație pur și simplu verifică semaforul, dar nu îl schimbă și nici nu blochează procesul Astfel, programele verifică mai întâi dacă semaforul poate fi jos Va funcționa această idee dacă există trei sau mai multe procese care rulează pe semafor? Ce se întâmplă dacă există două procese? Realizați un tabel care să arate, în funcție de timp de la la milisecunde, care dintre cele trei procese, PI, P și P , rulează și care sunt blocate Toate cele trei procese execută comenzile sus și jos pe același semafor Dacă două procese sunt blocate și este executată o comandă ip, atunci procesul cu un număr mai mic este pornit, adică P are prioritate față de P și P etc Inițial, toate cele trei procese rulează, iar valoarea semaforului este + La t = , P efectuează operația de jos ♦ La t = , P efectuează operația de jos ♦ La t = Р efectuează operația ip + La t = RZ efectuează operația de jos + La t = , P efectuează operația de jos + La t = Р efectuează operația ip ♦ La t = , P efectuează operația de jos + La t = Р efectuează operația ip + La t = Р efectuează operația ip Un sistem de rezervare a unei companii aeriene trebuie să se asigure că, în timp ce un proces utilizează un fișier, niciun alt proces nu poate utiliza fișierul În caz contrar, două procese diferite care funcționează pentru două agenții de bilete diferite vor putea vinde ultimul loc rămas la doi pasageri Dezvoltați o metodă de sincronizare folosind semafore pentru a vă asigura că doar un proces la un moment dat poate accesa un fișier (presupunând că procesele respectă anumite reguli) Pentru a face posibilă implementarea semaforelor pe un computer cu mai multe procesoare și memorie partajată, dezvoltatorii includ adesea o instrucțiune de verificare cu blocare (să-i spunem TSL) în mașină Echipa TSL X Prove Întrebări și sarcini Setează celula X Dacă conținutul celulei este , semaforele sunt setate la într-un ciclu de memorie indivizibil și următoarea instrucțiune este omisă Dacă conținutul celulei nu este , TSL funcționează ca o operație nulă Folosind comanda TSL, puteți scrie procedurile osc și debloca cu următoarele proprietăți: Procedura osc(x) verifică dacă variabila x este blocată Dacă nu, această procedură blochează x și revine; procedura uni osc va elibera blocarea existentă Dacă variabila x este deja blocată, procedura așteaptă pur și simplu până când este liberă înainte de a bloca x și a reveni Dacă toate procesele blochează tabelul de semafor înainte de a-l folosi, atunci doar un proces poate opera pe variabile și pointeri la un moment dat, ceea ce previne condițiile de cursă Scrieți procedurile osk și deblocați în assembler (Puteți face orice presupuneri rezonabile necesare pentru a rezolva problema ) Care vor fi valorile ip și out pentru un buffer de inel de de cuvinte după fiecare dintre următoarele operații? Inițial, valorile ip și out sunt ) de cuvinte sunt tamponate; ) cuvinte sunt eliminate din buffer; ) de cuvinte sunt tamponate; ) cuvinte sunt eliminate din buffer; ) cuvinte sunt tamponate; ) de cuvinte sunt eliminate din buffer; ) cuvinte sunt tamponate; ) cuvinte sunt eliminate din buffer Să presupunem că o versiune de UNIX utilizează blocuri de KB și stochează adrese de disc pe bloc de adrese indirecte (adresă indirectă obișnuită, dublă și triplă) Care va fi dimensiunea maximă a fișierului? Se presupune că indicatorii de fișiere sunt de de biți Să presupunem că următorul apel de sistem UNIX este executat în contextul fig : uni nk('Vusr/ast/bi n/game ") Descrieți în detaliu ce modificări vor avea loc în sistemul de directoare Imaginați-vă că trebuie să dezvoltați un sistem asemănător UNIX pentru un microcomputer în care memoria principală nu este suficientă După ce a rulat o perioadă lungă de timp, sistemul încă nu se potrivește în memorie și alegeți aleatoriu o funcție de sistem pe care să o sacrifici pentru binele mai mare Fie această funcție pipe, care creează conducte pentru transferul fluxurilor de octeți de la un proces la altul Este posibil să schimbi cumva intrarea-ieșire după aceea? Ce poți spune despre conducte? Luați în considerare problemele și soluțiile posibile Comisia de protecție a descriptorilor de fișiere a protestat împotriva sistemului UNIX deoarece, atunci când returnează un descriptor de fișier, acesta returnează întotdeauna cel mai mic număr liber în prezent urmă Capitolul Stratul sistemului de operare De fapt, este puțin probabil ca descriptorii de fișiere cu numere mari să fie utilizați deloc Comitetul insistă ca sistemul să returneze cel mai mic descriptor numerotat dintre cei care nu au fost încă utilizați de program și nu dintre cei care sunt liberi în acest moment Comisia susține că această idee este ușor de pus în aplicare, nu va afecta programele existente și este, de asemenea, mult mai corectă pentru descriptori Ce părere ai despre această? În Windows XP, puteți crea o listă de control al accesului, astfel încât Svetlana să nu aibă acces la niciunul dintre fișiere, iar toți ceilalți să aibă acces deplin la ele Cum să o facă? Descrieți două moduri de a programa producătorul și consumatorul în Windows XP: folosind tampoane și semafoare partajate Gândiți-vă la modul în care puteți implementa un buffer partajat în fiecare dintre cele două cazuri Performanța algoritmilor de înlocuire a paginii este de obicei testată prin simulare Să presupunem că doriți să scrieți un simulator care implementează memoria virtuală paginată pentru o mașină cu de pagini de K Programul trebuie să mențină un tabel de de elemente, un element pe pagină Fiecare element de tabel conține numărul fizic al paginii care corespunde paginii virtuale date Simulatorul trebuie să citească un fișier care conține adrese virtuale în notație zecimală, o adresă pe linie Dacă pagina corespunzătoare este în memorie, doar înregistrați faptul că pagina există Dacă nu este în memorie, apelați procedura de înlocuire a paginii pentru a selecta o pagină care poate fi ștearsă (adică, suprascrieți o intrare în tabel) și înregistrați faptul că pagina lipsește Nu este nevoie să implementați niciun transfer de pagină Creați un fișier format din adrese neconsecutive și testați performanța a doi algoritmi: LRU și FIFO Acum creați un fișier de adrese în care x% dintre adrese sunt cu octeți mai mari decât cele anterioare Rulați teste pentru diferite valori ale lui x și raportați rezultatele În programul prezentat în Listarea , apare o cursă fatală deoarece două fire de execuție de program accesează variabilele partajate în mod necontrolat Aceasta nu implică semafore sau alte tehnici de excludere reciprocă Rulați acest program și veți vedea că se va bloca după un timp Dacă tot nu se blochează, încercați să faceți codul mai vulnerabil plasând câteva calcule între operatorii de ajustare a valorii m in și m out și operatorii lor de verificare Cât de mult calcul ar trebui pus în acest program, astfel încât să se blocheze, să zicem, o dată pe oră? Scrieți un program UNIX sau Windows XP care ia ca intrare un nume de director Programul ar trebui să imprime o listă de fișiere din acest director, fiecare fișier pe o linie separată, iar după numele fișierului - dimensiunea acestuia Numele fișierelor trebuie să fie în ordinea în care apar în director Sloturile neutilizate din directoare ar trebui să fie afișate cu un semn (neutilizat) Capitolul Nivel de asamblare În capitolele , și , am discutat despre cele trei niveluri care pot fi găsite în arhitectura majorității computerelor moderne În acest capitol, vom vorbi despre un alt nivel, care este prezent și în arhitectura aproape tuturor mașinilor moderne Acesta este nivelul de asamblare Acest nivel diferă semnificativ de precedentul trei, deoarece este implementat prin traducere, nu prin interpretare Pentru a traduce programele utilizatorului dintr-un limbaj de programare în altul, au fost dezvoltate programe speciale, care se numesc traducători Limba în care a fost scris inițial programul se numește limba de intrare sau sursă, iar limba în care este tradus se numește ieșire sau țintă Atât limbajele de intrare, cât și limbile de ieșire determină conținutul nivelurilor ierarhice Dacă există un procesor care poate executa programe scrise în limba sursă, atunci nu este nevoie să traduceți programul sursă într-o altă limbă Traducerea este necesară dacă există un procesor (hardware sau software) pentru limba de ieșire, dar niciun procesor pentru limba de intrare Dacă traducerea se face corect, atunci programul tradus va da exact aceleași rezultate ca și originalul (dacă ar exista un procesor potrivit pentru el) Prin urmare, este posibil să se organizeze un nou strat, care va traduce mai întâi programele scrise pentru stratul de ieșire, apoi le va executa singur Este important să înțelegem diferența dintre traducere și interpretare La traducere, programul sursă în limba sursă nu este executat imediat În primul rând, este convertit într-un program echivalent, așa-numitul obiect sau program binar executabil, care este executat numai după finalizarea traducerii Adică, atunci când traduceți, trebuie să parcurgeți doi pași: Crearea unui program echivalent în limba țintă Executarea programului primit Acești doi pași nu se efectuează în același timp Al doilea pas începe abia după finalizarea primului Există un singur pas în interpretare: execuția programului original Nu trebuie generat niciun program echivalent, deși uneori programul sursă este convertit într-o formă intermediară (de exemplu, cod Java) pentru a simplifica interpretarea În timpul execuției unui program obiect sunt implicate doar trei niveluri: microarhitectura, arhitectura de instrucțiuni și sistemul de operare Prin urmare, În literatura internă, se obișnuiește să se numească atât interpretarea, cât și traducerea compilației (autorul numește aici traducerea compilație) Cu alte cuvinte, traducătorii pot fi fie compilatori, fie interpreți - Notă științific ed Capitolul Nivel de asamblare în timp ce un program rulează, trei programe pot fi găsite în memoria computerului: programul obiect utilizator, sistemul de operare și firmware-ul (dacă există) Nu rămâne nicio urmă din programul original Adică, numărul de niveluri în timpul execuției programului poate să nu se potrivească cu numărul de niveluri înainte de traducere De remarcat că în această carte definim apartenența la un anumit nivel prin comenzile și constructele de limbaj disponibile programatorilor de acest nivel (și nu prin tehnologia de implementare), în timp ce unii autori fac distincție între niveluri implementate de interpreți și compilatori Introducere în asamblare Traducătorii pot fi împărțiți în două grupuri, în funcție de relația dintre limbile de intrare și de ieșire Dacă limbajul de intrare este o reprezentare simbolică a unui limbaj numeric de mașină, atunci traducătorul se numește asamblator, iar limbajul de intrare se numește limbaj de asamblare sau pur și simplu asamblator Dacă limbajul de intrare este un limbaj de nivel înalt (cum ar fi Java sau C) și limbajul de ieșire este fie un limbaj numeric de mașină, fie o reprezentare simbolică a acestuia din urmă, atunci traducătorul este numit compilator Conceptul de asamblator Limbajul de asamblare este un limbaj în care fiecare instrucțiune corespunde exact unei instrucțiuni de mașină Cu alte cuvinte, într-un program scris în asamblator, există o corespondență unu-la-unu între instrucțiunile mașinii și operatori Dacă fiecare linie dintr-un program de asamblare conține exact o declarație și fiecare cuvânt de mașină conține exact o instrucțiune, atunci un program de asamblare de n linii va produce un program de limbaj de mașină cu n cuvinte Programăm în limbaj de asamblare, nu în limbaj mașină (în hexazecimal), pentru că este mult mai ușor Este mult mai convenabil să folosiți nume și adrese simbolice în loc de cele binare și octale Mulți oameni își pot aminti că simbolurile pentru adunare (adunare), scădere (scădere), înmulțire (înmulțire) și împărțire (împărțire) sunt comenzile ADD, SUB, MUL și DIV, dar puțini își vor aminti valorile numerice corespunzătoare care sunt folosite pentru aceste comenzi car Un programator în limbaj de asamblare trebuie să cunoască doar numele simbolice, deoarece asamblatorul le traduce în instrucțiuni de mașină Această declarație se aplică și adreselor Un programator de limbaj de asamblare poate da nume simbolice locațiilor de memorie și este la latitudinea asamblatorului să se ocupe de obținerea valorilor numerice corecte din ele În același timp, un programator care scrie în limbajul mașinii trebuie întotdeauna să lucreze cu valori numerice ale adresei Acum nu mai există programatori care scriu programe în limbaj mașină, deși cu câteva decenii în urmă, înainte de inventarea asamblatorilor, programele erau scrise așa Introducere în asamblare Limbajul de asamblare are mai multe caracteristici care îl deosebesc de limbajele de nivel înalt În primul rând, aceasta este o corespondență unu-la-unu între instrucțiunile limbajului de asamblare și instrucțiunile mașinii (am vorbit deja despre asta) În al doilea rând, programatorul care scrie în assembler are acces la toate obiectele și comenzile mașinii țintă Programatorii care scriu în limbaje de nivel înalt nu au acest acces De exemplu, dacă mașina țintă conține un bit de overflow, un program de asamblare îl poate verifica, dar un npo-gram Java nu Un program de limbaj de asamblare poate executa orice instrucțiune din setul de instrucțiuni al mașinii țintă, dar un program de limbaj de nivel înalt nu poate Pe scurt, tot ceea ce se poate face în limbajul mașină poate fi făcut în asamblator, dar, în același timp, multe comenzi, registre și alte obiecte nu sunt disponibile programatorilor care scriu programe în limbaje de nivel înalt Limbajele de programare a sistemelor (cum ar fi C) se află adesea undeva la mijloc Ei, deși au o sintaxă inerentă limbajelor de nivel înalt, sunt mai aproape de asamblare în ceea ce privește accesibilitatea În cele din urmă, un program de asamblare poate rula doar pe computere din aceeași familie, în timp ce un program scris într-un limbaj de nivel înalt poate rula pe mașini diferite Capacitatea de a transfera software de la o mașină la alta este foarte importantă pentru multe aplicații Scopul asamblatorului Nu este ușor de lucrat cu limbajul de asamblare Scrierea aceluiași program în assembler necesită mult mai mult timp decât într-un limbaj de nivel înalt În plus, depanarea durează foarte mult timp Dar de ce atunci scrieți programe în asamblare? Există două motive: performanță și acces la hardware În primul rând, un programator asamblator calificat poate scrie un program mult mai mic și mult mai rapid decât unul scris într-un limbaj de nivel înalt Pentru unele programe, viteza și volumul sunt extrem de importante Această categorie include multe aplicații încorporate (de exemplu, carduri inteligente, telefoane mobile, drivere de dispozitiv) și rutine BIOS Următorul motiv este că unele proceduri necesită acces complet la hardware, ceea ce de obicei nu este posibil cu limbaje de nivel înalt În această categorie se încadrează gestionatorii de întreruperi și excepții ale sistemului de operare, precum și controlerele de dispozitiv pentru sistemele încorporate în timp real Primul motiv (atingerea unor performanțe ridicate) este mai important, așa că îl vom analiza mai detaliat În majoritatea programelor, doar un mic procent din tot codul contribuie la timpul de execuție a programului De obicei, % din cod este responsabil pentru % din timpul de execuție, iar % din cod este responsabil pentru % din timpul de execuție Să presupunem că este nevoie de ani-om pentru a scrie un program într-un limbaj de nivel înalt, iar programul rezultat durează de secunde pentru a se executa Capitolul Nivel de asamblare un program tipic de control (Un program de referință este un program de testare care este folosit pentru a compara computere, compilatoare și așa mai departe ) Scrierea unui program întreg în assembler poate dura de ani-om Programul de control rezultat va rula în aproximativ de secunde, deoarece un programator bun poate fi de până la trei ori mai inteligent decât un compilator (deși acest lucru poate fi argumentat la nesfârșit) Tabelul ilustrează situația Tabelul Comparație de programare în limbaj de asamblare și limbaj de nivel înalt Timp de programare, ani om Timp de executare a programului, s Limbajul de asamblare Limbă de nivel înalt Abordare mixtă a ajustării Critic % Restul de % Total Abordare mixtă după ajustare Critic % Restul de % Total Deoarece doar o mică parte a programului este responsabilă pentru cea mai mare parte a timpului de execuție al programului, este posibilă o altă abordare În primul rând, programul este scris într-un limbaj de nivel înalt Apoi sunt efectuate o serie de măsurători pentru a determina care părți ale programului contribuie cel mai mult la timpul de execuție Pentru astfel de măsurători, se folosește de obicei ceasul de sistem Cu acesta, puteți afla cât durează fiecare procedură, de câte ori este efectuat fiecare ciclu etc Să presupunem că % din program este responsabil pentru % din timpul său de execuție Aceasta înseamnă că din de secunde de lucru, de secunde reprezintă a zecea parte a programului, iar secunde - restul de % Aceste % din program pot fi îmbunătățite prin rescriere în assembler Acest proces se numește tuning Va dura încă ani-om pentru a ajusta procedurile de bază, dar timpul de execuție a programului va fi redus de la la de secunde Să comparăm această abordare mixtă, folosind atât limbajul de asamblare, cât și limbajul de nivel înalt, cu abordarea care utilizează numai limbajul de asamblare (vezi Tabelul ) Cu a doua abordare, programul rulează cu aproximativ % mai rapid ( față de de secunde), dar cu mai mult de trei costuri ( față de ani-om) Mai mult decât atât, abordarea mixtă are un alt avantaj: este mult mai ușor să rescrieți o procedură deja depanată scrisă într-un limbaj de nivel înalt în assembler decât să scrieți această procedură în assembler de la zero Rețineți că, dacă scrierea unui program a durat exact an, raportul dintre Introducere în asamblare o abordare mixtă și o abordare numai de adunare ar fi : în favoarea abordării mixte În același timp, un programator care scrie într-un limbaj de nivel înalt nu trebuie să se gândească la mutarea biților individuali, astfel încât să se gândească la problema în ansamblu și, uneori, reușește să construiască un program în așa fel încât să realizează o creștere reală a performanței Această situație nu este de obicei tipică pentru programatorii de asamblare - de regulă, aceștia se luptă cu instrucțiuni individuale, încercând să salveze câteva cicluri Oricum ar fi, există cel puțin motive bune pentru a învăța limbajul de asamblare În primul rând, este de dorit să se poată scrie programe în asamblator, deoarece succesul sau eșecul unui proiect mare depinde uneori de dacă va fi sau nu posibilă sau nu creșterea de mai multe ori a vitezei unei singure, dar importante proceduri În al doilea rând, accesarea asamblatorului poate fi singura cale de ieșire posibilă în caz de deficit de memorie Cardurile inteligente, de exemplu, conțin o unitate centrală de procesare, dar puține dintre ele au chiar și un megaoctet de memorie și foarte puține au un hard disk pentru paginare Cu toate acestea, cu resurse atât de limitate, trebuie să efectueze calcule complexe Procesoarele încorporate în aparatele electrice au adesea o cantitate minimă de memorie, deoarece trebuie să fie rezonabil de ieftine O cantitate la fel de mică de memorie este de obicei furnizată cu diferite dispozitive electronice alimentate cu baterii, deoarece au nevoie de un cod compact, dar eficient În al treilea rând, compilatorul trebuie fie să producă un program la ieșire care poate fi utilizat de către asamblator, fie să execute independent asamblarea Astfel, cunoașterea limbajului de asamblare este esențială pentru înțelegerea modului în care funcționează un computer Și, în general, cineva trebuie să scrie compilatorul (și asamblatorul acestuia) În cele din urmă, asamblatorul oferă o idee grozavă despre mașina reală Pentru cei care studiază arhitectura computerelor, scrierea codului de asamblare este singura modalitate de a afla ce este o mașină Format operator în asamblator Deși structura unei instrucțiuni de asamblare reflectă structura instrucțiunii de mașină corespunzătoare, limbajele de asamblare pentru diferite mașini și niveluri diferite sunt similare în multe feluri, ceea ce face posibil să vorbim despre limbajul de asamblare în ansamblu Listările - arată fragmente de cod în asamblatoarele Pentium , Motorola x și (Ultra)SPARC Toate aceste programe evaluează formula N = I + J În toate cele trei exemple, instrucțiunile de deasupra șirului gol efectuează calculul, iar instrucțiunile de sub șirurile goale rezervă memorie pentru variabilele I, J și N Adică, ultimele afirmații nu sunt reprezentări simbolice ale instrucțiunilor mașinii Pentru computerele din familia Intel, există mai mulți asamblatori care diferă unul de celălalt ca sintaxă În această carte, vom folosi limbajul de asamblare Microsoft MASM Și deși vom vorbi despre procesor Capitolul Nivel de asamblare Pentium , toate cele de mai sus se aplică procesoarelor , , Pentium și Pentium Pro Pentru procesorul SPARC, vom folosi asamblatorul Sun și tot acest lucru se aplică și versiunilor anterioare pe de biți În cartea codurilor operațiunile și registrele sunt întotdeauna indicate cu majuscule, iar nu doar pentru asamblator Pentium , ca de obicei, dar si pentru asamblator Sun, unde prin convenție literele sunt mici Lista Calcularea expresiei N = I + j în asamblatorul Pentium FORMULA: my EAX I înregistrez EAX = I Adăugați registrul EAX,J EAX = I + J MOV N EAX N=I+J DD rezerv octeți și îi inițializez la J DD rezervă octeți și inițializați-i la N DD rezervă octeți și inițializați-i la Lista Calculul expresiei N = I + j în asamblatorul Motorola x FORMULA MOVE L I DO registru DO = I ADD L J DO registrul DO = I + J MUȚI L DO NN = I + j I DC L : rezervă octeți : și inițializați-i la J DC L : rezervă octeți : și inițializați-i la N DC L ; rezervare octeți; iar inițializarea lor la Lista Evaluarea expresiei N = I + J în asamblatorul SPARC FORMULA: SETHI W(I) JRl ! R = MSB-uri de adresa I LD! R = I SETHI ^HI(J) JR ! R = biți înalți ai adresei J LD L£R +£L (J)LW ! R =J NOP! în aşteptarea lui J din memorie ADAUGĂ £R JR ,£R ! R = Rl + R SETHI ^HI(N) JRl ! R = MSB-uri ale adresei N ST Ш, [Ш+ШХУ] I: CUVINTUL ! rezervare octeți! iar initializarea lor cu valoarea J: CUVINTUL ! rezervare octeți! și inițializarea valorii lor - N: CUVANT ! rezervare octeți! și inițializarea valorii lor Declarațiile de asamblare constau din patru câmpuri: etichete, operații, operanzi și comentarii Etichetele servesc ca nume simbolice pentru adresele de memorie Acestea vă permit să săriți la comenzi și date, permițându-vă să accesați locul în care comenzile și datele sunt stocate printr-un nume simbolic Dacă o declarație este etichetată, eticheta este de obicei plasată la începutul liniei Fiecare dintre cele trei exemple are etichete: FORMULA, I, J și N Rețineți că asamblatorul SPARC necesită două puncte după fiecare etichetă, în timp ce asamblatorul Motorola nu În asamblatorul computerelor Intel, se pune doar două puncte Introducere în asamblare după etichetele de comandă, dar nu după etichetele de date Această diferență nu este deloc fundamentală, ci doar că dezvoltatorii diferiților asamblatori au gusturi diferite Arhitectura mașinii nu influențează în niciun fel cutare sau cutare alegere Singurul avantaj al două puncte este că puteți scrie eticheta pe o linie separată și opcode-ul pe următoarea linie, indentată în același mod ca eticheta Fără două puncte, ar fi imposibil pentru compilator să distingă eticheta de codul operațional atunci când este plasat pe linii separate La unele asamblatoare, lungimea etichetei este limitată la sau caractere În același timp, în majoritatea limbilor de nivel înalt, lungimea numelor este arbitrară Numele lungi și bine alese fac programul mai ușor de citit și de înțeles Fiecare mașină are mai multe registre, dar au nume complet diferite Registrele Pentium se numesc EAX, EBX, ECX etc , registrele Motorola sunt DO, Dl, D , registrele SPARC au mai multe denumiri În această carte, vom folosi simbolurile Ш și #R pentru a le reprezenta Câmpul opcode conține fie abrevierea simbolică a acestui cod (dacă operatorul este o reprezentare simbolică a unei instrucțiuni de mașină), fie instrucțiunea asamblatorului însuși Alegerea numelui este o chestiune de gust și, prin urmare, diferiți dezvoltatori le numesc diferit Proiectanții de asamblare Intel au ales să folosească denumirea MOV atât pentru încărcarea unui registru din memorie, cât și pentru salvarea unui registru în memorie, designerii de asamblare Motorola au ales denumirea MOVE pentru ambele operațiuni, iar designerii de asamblare SPARC au decis să folosească simbolurile LD pentru prima operație și ST pentru al doilea Evident, alegerea numelor în acest caz nu are nimic de-a face cu arhitectura mașinii Dimpotrivă, necesitatea de a specifica două instrucțiuni de mașină pentru accesul la memorie este explicată de arhitectura SPARC, deoarece adresele virtuale pot fi pe de biți (ca în SPARC versiunea ) și pe de biți (ca în SPARC versiunea ) și instrucțiuni poate conține maximum de biți de date Prin urmare, sunt întotdeauna necesare două comenzi pentru a transmite toți biții ai adresei virtuale complete De exemplu: sethi ^nkі), ta Această instrucțiune setează cei de biți înalți și cei biți inferiori ai registrului de de biți R la zero și apoi plasează cei de biți înalți ai adresei de de biți a variabilei I în pozițiile de biți de la la ale registrului R Mai departe: io[w+shhsh Această instrucțiune adaugă R și cei biți inferiori ai adresei I (rezultând adresa completă a lui I), apelează cuvântul dat din memorie și îl plasează în registrul R Aceste comenzi, sincer, nu sunt foarte elegante, dar dezvoltatorii SPARC nu au urmărit frumusețea Li s-a dat sarcina de a asigura o viteză mare de execuție și au rezolvat-o cu succes Procesoarele din familia Pentium, x și SPARC vă permit să lucrați cu operanzi de diferite lungimi (dimensiune octet, cuvânt și cuvânt lung) Cum determină asamblatorul lungimea operanzilor? Și din nou, dezvoltatorii diferiților asamblatori au luat decizii diferite În Pentium , registrele de lungimi diferite au nume diferite De exemplu, pentru a muta valori pe de biți, utilizați Capitolul Nivel de asamblare se numește EAX, pentru biți - AX, iar pentru biți - AL și AH Designerii de asamblare Motorola au decis să sufix fiecare cod operațional cu L pentru lung, W pentru cuvânt și B pentru octet SPARC folosește coduri operaționale diferite pentru operanzi de lungimi diferite, de exemplu, pentru a încărca un octet, o jumătate de cuvânt și un cuvânt într-un registru de de biți, codurile operaționale sunt LDSB, LDSH și, respectiv, LDSW După cum puteți vedea, natura limbilor este complet arbitrară Cei trei asamblatori pe care îi analizăm diferă în modul în care alocă spațiu pentru date Designerii de asamblare Intel au ales numele DD (Define Double) pentru această operație deoarece cuvântul procesorului avea o lungime de biți Motorola folosește abrevierea DC (Define Constant) Dezvoltatorii SPARC au preferat de la început numele WORD Din nou, diferențele sunt complet aleatorii Câmpul operanzi al operatorului specifică adresele și registrele care sunt operanzii instrucțiunii mașinii În domeniul operanzilor instrucțiunii de adăugare a întregului, se indică ce trebuie adăugat și la ce Câmpul operand instrucțiunii de salt determină locul în care se face saltul Operanzii pot fi registre, constante, locații de memorie etc Câmpul de comentarii explică acțiunile programului Aceste explicații pot fi utile programatorilor care trebuie apoi să utilizeze și să modifice programul altcuiva, precum și autorului însuși al programului când revine să lucreze la el un an mai târziu Un program de asamblare fără astfel de comentarii este ceva complet de neinteligibil (chiar și pentru autorul său) Comentariile pot fi utile doar oamenilor și nu afectează în niciun fel funcționarea programului directive Programul de asamblare definește nu numai instrucțiunile mașinii pe care procesorul trebuie să le execute, ci și instrucțiunile pe care asamblatorul însuși trebuie să le execute (de exemplu, alocă o anumită memorie sau emite o nouă pagină de listare) Comenzile de asamblare sunt numite pseudo-comenzi sau directive de asamblare În Listarea , am văzut deja o pseudo-comandă tipică DD În tabel listează alte pseudo-comenzi (directive) Acestea sunt preluate din asamblatorul MASM din familia de asamblare Intel Tabelul Unele directive de asamblare MASM Descrierea directivei SEGMENT Începutul unui nou segment (text, date etc ) cu atribute definite ENDS Încheiați segmentul curent ALIGN Controlează alinierea următoarei comenzi sau date EQU Definiți un nou caracter egal cu expresia dată Alocarea memoriei DB pentru unul sau mai mulți octeți DW Alocarea memoriei pentru unul sau mai multe jumătăți de cuvinte de biți DD Alocarea memoriei pentru unul sau mai multe cuvinte de de biți Introducere în asamblare Descrierea directivei DQ Alocarea memoriei pentru unul sau mai multe cuvinte duble pe de biți PROC Porniți procedura ENDP Încheiați procedura MACRO Pornire macro ENDM End macro PUBLIC Exportați numele definit în acest modul EXTERN Importați numele dintr-un alt modul INCLUDE Apelați un alt fișier și includeți-l în fișierul curent IF Începe asamblarea condiționată a programului pe baza expresiei date ELSE Porniți asamblarea condiționată a programului dacă nu este îndeplinită condiția pentru directiva IF ENDIF Încheiați asamblarea programului condiționat COMMENT Specificarea unui nou caracter de început pentru câmpul de comentariu PAGE Forțați o întrerupere de pagină într-o listă Sfârșit Încheiați programul de asamblare Directiva SEGMENT începe un nou segment, iar directiva ENDS îl încheie Este permis să începeți un segment de text, apoi să începeți un segment de date, apoi să săriți înapoi la un segment de text și așa mai departe Directiva ALIGN transmite următorul șir (de obicei date) la adresa dată de argumentul directivei De exemplu, dacă segmentul curent conține deja de octeți de date, atunci după ce directiva ALIGN este executată, următoarea adresă alocată va fi adresa Directiva EQII dă un nume simbolic unei expresii De exemplu, după următoarea directivă, caracterul BASE poate fi folosit în program în loc de valoarea : VAZA EQU Expresia care urmează directivei EQU poate conține mai multe caractere unite prin aritmetici și alți operatori, de exemplu: LIMIT EQU * VAZE + Majoritatea asamblatorilor, inclusiv MASM, necesită ca un simbol să fie definit în program înainte de a apărea într-o expresie ca aceasta Directivele DB, DD, DW și DQ alocă memorie pentru una sau mai multe variabile de , , și, respectiv, octeți De exemplu: TABEL DB I Această directivă alocă spațiu pentru octeți și le setează la valorile inițiale AND, și respectiv și, de asemenea, definește un caracter TABLE egal cu adresa unde este stocată valoarea AND Capitolul Nivel de asamblare Directivele PROC și ENDP definesc începutul și sfârșitul rutinelor de asamblare Procedurile din asamblare îndeplinesc același rol ca și în limbajele de programare de nivel înalt Directivele MACRO și ENDM definesc începutul și sfârșitul unei macrocomenzi Vom vorbi despre macrocomenzi în secțiunea următoare Directivele PUBLIC și EXTERN determină vizibilitatea (accesibilitatea) simbolurilor Programele sunt adesea scrise ca o colecție de fișiere Uneori, o procedură dintr-un fișier trebuie să apeleze o procedură sau să acceseze date definite într-un alt fișier Pentru a face posibile astfel de referințe încrucișate între fișiere, caracterul (numele) care urmează să fie pus la dispoziția altor fișiere este exportat utilizând directiva PUBLIC Pentru ca asamblatorul să nu emită avertismente despre utilizarea unui simbol care nu este definit în acest fișier, acest simbol poate fi declarat extern (EXTERN), adică definit într-un alt fișier Simbolurile care nu sunt definite în niciuna dintre aceste directive pot fi utilizate numai în cadrul aceluiași fișier Prin urmare, chiar dacă, de exemplu, simbolul F apare în mai multe fișiere, acest lucru nu va provoca niciun conflict, deoarece simbolul specificat este local pentru fiecare fișier Directiva INCLUDE determină asamblatorul să apeleze un alt fișier și să îl includă în cel curent Aceste fișiere incluse conțin adesea definiții, macrocomenzi și alte elemente necesare diferitelor fișiere Multe limbaje de asamblare, inclusiv MASM, acceptă asamblarea condiționată a programelor De exemplu: WORDSIZE EQU IF WORDSIZE GT WSIZE: DW ELSE DIMENSIUNEA W: DW ENDIF Acest program alocă un cuvânt de de biți în memorie și își apelează adresa WSIZE Acest cuvânt primește una dintre valorile: fie , fie , în funcție de valoarea WORDSIZE (în acest caz, ) Acest design poate fi folosit în programe pentru mașini pe biți (cum ar fi ) sau pe de biți (cum ar fi Pentium ) Dacă introduceți directivele IF și ENDIF la începutul și la sfârșitul codului specific mașinii și apoi modificați definiția unică, WORDSIZE, programul poate fi ajustat automat la una dintre cele două dimensiuni Folosind această abordare, puteți utiliza un astfel de program sursă pentru mai multe mașini diferite În cele mai multe cazuri, toate definițiile specifice mașinii, cum ar fi WORDSIZE, sunt stocate într-un singur fișier și ar trebui să existe fișiere diferite pentru diferite mașini Prin includerea unui fișier cu definițiile necesare, programul poate fi ușor recompilat pentru diferite mașini Directiva COMMENT permite utilizatorului să înlocuiască caracterul de început al comentariului (punct și virgulă) cu altceva Directiva PAGE este folosită pentru a controla listarea unui program În cele din urmă, directiva END marchează sfârșitul programului Există multe mai multe directive în asamblatorul MASM Alți asamblatori Pentium conțin un set diferit de directive, deoarece aceste directive sunt determinate nu de arhitectura mașinii, ci de gusturile dezvoltatorilor de asamblare Macro-uri Macro-uri De obicei, programatorii care scriu în limbaj de asamblare trebuie să repete aceleași lanțuri de comandă iar și iar Deși este cel mai ușor să scrieți comenzile potrivite ori de câte ori sunt necesare, devine plictisitor, mai ales dacă secvența este suficient de lungă sau dacă trebuie repetată prea des O abordare alternativă este de a încheia această secvență într-o procedură și de a o apela atunci când este necesar Această strategie are și dezavantajele ei, deoarece în acest caz va trebui să executați o instrucțiune de apel de procedură specială și o instrucțiune de returnare de fiecare dată Dacă secvențele de instrucțiuni sunt scurte (de exemplu, doar două instrucțiuni), dar sunt utilizate frecvent, atunci apelurile de procedură pot afecta semnificativ performanța programului Macro-urile sunt o soluție simplă și eficientă la această problemă Definiție macro, apel macro și extinderea macro O macrocomandă este o modalitate de a da un nume unei bucăți de cod După ce macro-ul este definit, programatorul poate scrie numele macro-ului în loc de un fragment de cod În esență, o macrocomandă este doar numele unei bucăți de cod Lista - arată un program de asamblare Pentium care schimbă de două ori valorile variabilelor P și Q Iată cum arată lanțul principal de instrucțiuni: MOV EAX P MOV EBX Q MOV Q EAX MOV P EBX Lista definește această secvență ca macrocomandă SWAP Lista Modificarea valorilor variabilelor P și Q fără a utiliza o macrocomandă MOV EAX P MOV EBX Q MOV Q EAX MOV P EBX MOV EAX R MOV EBX Q MOV Q EAX MO V P EBX Lista Modificarea valorilor variabilelor P și Q folosind o macrocomandă SWAP MACRO MOV EAX R MOV EBX Q MOV Q EAX MOV P EBX ENDM SWAP SWAP Capitolul Nivel de asamblare Deși definiția unei macrocomenzi arată ușor diferită în diferite limbaje de asamblare, în total ea constă din aceleași părți de bază: ♦ antet macro, care dă denumirea macro-ului care se definește; ♦ text care conține corpul macro-ului; ♦ O directivă care completează definiția (ex ENDM) Când asamblatorul întâlnește o definiție de macro într-un program, o stochează în tabelul de definiții de macro pentru o utilizare ulterioară Ori de câte ori o macrocomandă (în exemplul nostru, SWAP) apare ca un cod operațional în program, asamblatorul o va înlocui cu corpul macrocomenzii Utilizarea unui nume de macrocomandă ca opcode se numește apel de macrocomandă, iar înlocuirea acestuia cu un corp de macrocomandă se numește extindere macro Extinderea macro-ului are loc în timpul asamblarii, nu în timpul execuției programului Acest moment este foarte important Programele din listele - și - generează același cod de mașină Este imposibil să se stabilească dintr-un program în limbajul mașinii dacă au fost utilizate macrocomenzi atunci când a fost generat sau nu Nu există semne de macrocomenzi în programul rezultat Apelurile macro nu trebuie confundate cu apelurile de procedură Principala diferență este că un apel macro este o comandă către asamblator pentru a înlocui numele macrocomenzii cu corpul macrocomenzii Un apel de procedură este o instrucțiune de mașină care, odată introdusă într-un program obiect, trebuie executată ulterior pentru a apela procedura În tabel compară apelurile macro și apelurile de procedură Tabelul Compararea apelurilor macro și a apelurilor de procedură Apel macro Apel de procedură Când se face apelul? În timpul asamblarii În timpul executării programului Corpul macrocomenzii sau procedurii este inserat în programul obiect de fiecare dată când se efectuează apelul? Nu chiar Este o instrucțiune de apel de procedură inserată într-un program obiect, care este apoi executat? Nu da Trebuie să folosesc comanda return după apel? Nu da Câte copii ale corpului unui apel macro sau proceduri apar într-un program obiect? Unul pentru apel macro Unul Putem considera că procesul de asamblare are loc în două treceri La prima trecere, toate definițiile macro sunt păstrate și apelurile macro sunt extinse La a doua trecere, textul rezultat este procesat Cu alte cuvinte, programul original este citit și apoi transformat într-un alt program din care sunt eliminate toate definițiile macro și în care fiecare apel de macro este înlocuit cu un corp de macro Programul rezultat fără macro-uri este apoi introdus în asamblator Macro-uri Este important să rețineți că un program este un șir de caractere, care pot fi litere, numere, spații, semne de punctuație și întoarceri de căruță (întreruperi de linie) Extinderea macro-ului înlocuiește anumite subșiruri din acest șir cu alte șiruri de caractere Macro-urile sunt un mijloc de manipulare a șirurilor de caractere fără a le schimba sensul Macro-uri cu parametri Macro-urile descrise în subsecțiunea anterioară pot fi folosite pentru a reduce volumul programelor care repetă adesea aceeași secvență de comenzi Cu toate acestea, uneori un program conține mai multe secvențe de comenzi similare, dar nu identice De exemplu, în Lista - , prima secvență schimbă valorile P și Q, iar a doua schimbă R și S Lista Modificarea valorilor a două perechi de variabile fără a utiliza macro-ul MOV EAX P MOV EBX Q MOV Q EAX MOV P EBX MOV EAX R MOV EBX S MOV S EAX MOV R EBX Pentru a face față unor astfel de secvențe aproape identice, sunt furnizate definiții macro care oferă parametri formali și apeluri macro, în care parametrii formali sunt înlocuiți cu parametri reali Parametrii actuali sunt plasați în câmpul operand al apelului macro Lista Programul prezentat în Listarea include o macrocomandă cu doi parametri Simbolurile P și P sunt parametri formali În timpul extinderii macro, fiecare caracter P din corpul macro-ului este înlocuit cu primul parametru real, iar caracterul P cu al doilea parametru real Exemplu: SCHIMBA PQ În acest apel macro, P este primul parametru real și Q este al doilea parametru real Astfel, programele din listele și sunt identice Lista Modificarea valorilor a două perechi de variabile folosind macro-ul CHANGE MACRO P P MOV EAX PI MOV EBX P MOV P EAX MOV Pl EBX ENDM SCHIMBA PQ SCHIMBA RS Capitolul Nivel de asamblare Caracteristici suplimentare Majoritatea procesoarelor macro acceptă o serie de caracteristici suplimentare care facilitează munca unui programator în limbaj de asamblare În această subsecțiune, ne vom uita la câteva funcții suplimentare ale asamblatorului MASM Toți asamblatorii au o problemă: duplicarea etichetelor Să presupunem că macro-ul conține o instrucțiune de ramificare condiționată și o etichetă la care sări Dacă macro-ul este apelat de două sau de mai multe ori, eticheta va fi duplicată, ceea ce va provoca o eroare Prin urmare, programatorul trebuie să atribuie o etichetă fiecărui apel ca parametru O altă soluție (folosită în MASM) este declararea etichetei locale (LOCAL), caz în care asamblatorul va genera automat o etichetă diferită de fiecare dată când macro-ul este extins În unele asamblatoare, etichetele numerice sunt considerate locale în mod implicit MASM și majoritatea celorlalți asamblatori permit definirea macrocomenzilor în cadrul altor macrocomenzi Această caracteristică este foarte utilă în combinație cu asamblarea programelor condiționate De obicei, aceeași macrocomandă este definită în ambele ramurile lor ale declaraţiei IF: Ml MACRO M IF WORDSIZE GT MACRO M ENDM ELSE MACRO ENDM ENDIF ENDM În ambele cazuri, macro-ul M va fi definit, dar definiția depinde dacă programul este asamblat pe o mașină de biți sau de biți Dacă M nu este apelat, macro M nu va fi definită deloc Unele macrocomenzi pot apela alte macrocomenzi, inclusiv ele însele Dacă macro-ul este recursiv, adică se autoinvocă, trebuie să-și transmită un parametru (care se schimbă cu fiecare extindere), apoi verifică acel parametru și încheia recursiunea când parametrul atinge o anumită valoare În caz contrar, va rezulta o buclă infinită, iar apoi utilizatorul va trebui să finalizeze asamblarea manual Implementarea macro-urilor în asamblator Pentru a implementa macrocomenzi, asamblatorul trebuie să poată îndeplini două funcții: să păstreze definițiile macro și să extindă apelurile macro Ne vom uita pe rând la aceste funcții Asamblatorul trebuie să mențină un tabel cu toate numele macrocomenzilor, în care fiecare nume este urmat de un indicator către definiția acelei macrocomenzi, astfel încât să poată fi preluat dacă este necesar Unii asamblatori oferă un tabel separat pentru numele macrocomenzilor, în timp ce alții conțin un tabel comun în care proces de asamblare Torusul conține nu numai numele macro, ci și toate comenzile și directivele mașinii Când se întâlnește o definiție de macrocomandă, este creată o nouă intrare de tabel cu numele macrocomenzii, numărul de parametri și un pointer către un alt tabel care va stoca corpul macrocomenzii În acest moment, este creată și o listă de parametri formali Corpul macrocomenzii este apoi citit și stocat în tabelul de definire a macrocomenzii Parametrii formali care apar în corpul buclei sunt indicați printr-un caracter special Mai jos este un exemplu de reprezentare internă a macrocomenzii CHANGE Caracterul de întoarcere caruș este un punct și virgulă, iar caracterul parametru formal este un ampersand MOV EAX,&P ;MOV EBX &P :MOV &P EAX;MOV &P EBX: În tabelul de definire a macrocomenzii, corpul unei macrocomenzi este pur și simplu un șir de caractere La asamblare, în timpul primei treceri, se găsesc opcodes și macrocomenzi sunt extinse Ori de câte ori este întâlnită o definiție macro, aceasta este stocată în tabelul macro Când este apelată o macrocomandă, asamblatorul întrerupe temporar citirea datelor de intrare de pe dispozitivul de intrare și începe să citească corpul stocat al macrocomenzii Parametrii formali extrași din corpul macro-ului sunt înlocuiți cu parametrii actuali care sunt furnizați atunci când sunt apelați Un ampersand în fața parametrilor permite asamblatorului să-i recunoască proces de asamblare Următoarele subsecțiuni arată cum funcționează asamblatorul Și deși asamblatorii diferitelor mașini sunt diferiți, procesul de asamblare este în esență același Asamblare în două treceri Deoarece un program de asamblare constă dintr-o serie de instrucțiuni, la prima vedere poate părea că asamblatorul trebuie să citească mai întâi declarația, apoi să o traducă în limbajul mașinii și, în final, să transfere limbajul mașinii rezultat într-un fișier, iar fragmentul de listare corespunzător în alt dosar Acest proces trebuie repetat până când întregul program a fost tradus Din păcate, însă, această strategie nu funcționează Luați în considerare o situație în care prima instrucțiune este un salt la adresa L Asamblatorul nu poate asambla instrucțiunea până când nu cunoaște adresa L Dar adresa L poate fi undeva la sfârșitul programului și atunci asamblatorul nu poate găsi această adresă fără citind întregul program Această problemă se numește problema referinței înainte și constă în faptul că caracterul L este folosit înainte de a fi definit (adică este accesat caracterul, a cărui definiție va apărea ulterior) Legăturile directe pot fi gestionate în două moduri În primul rând, asamblatorul poate citi programul de două ori Fiecare citire a programului sursă se numește trecere și un traducător care citește programul sursă de două ori Capitolul Nivel de asamblare numită cu două sensuri La prima trecere, toate definițiile simbolurilor, inclusiv etichetele, sunt colectate și stocate într-un tabel În momentul în care începe cea de-a doua trecere, valorile simbolului sunt deja cunoscute, astfel încât nu apare nicio referință înainte și fiecare declarație poate fi citită și asamblată Deși acest lucru necesită o trecere suplimentară prin programul original, această strategie este relativ simplă În a doua abordare, programul de asamblare este citit o dată și convertit într-o formă intermediară, iar această formă intermediară este stocată într-un tabel Apoi face a doua trecere, dar nu conform programului original, ci conform tabelului Dacă există suficientă memorie fizică (sau virtuală) pentru această abordare, timpul petrecut în procesul I/O este salvat Dacă o listă trebuie să apară în timpul asamblarii, atunci declarațiile originale, inclusiv comentariile, sunt complet păstrate Dacă listarea nu este necesară, atunci forma intermediară poate fi scurtată, lăsând doar cele mai esențiale Un alt obiectiv al primei treceri este de a păstra toate macrocomenzile și de a extinde apelurile pe măsură ce apar Prin urmare, atât definirea caracterului, cât și extinderea macro au loc în aceeași trecere Prima trecere Scopul principal al primei treceri este de a construi un tabel de simboluri care să conțină valorile tuturor simbolurilor Un simbol poate fi fie o etichetă, fie o valoare căreia i se atribuie un nume simbolic specific prin intermediul unei directive: BUFSIZE EQU Atribuind o valoare unui nume simbolic în câmpul de etichetă al unei instrucțiuni, asamblatorul trebuie să știe ce adresă va avea acea instrucțiune în timpul rulării Pentru a face acest lucru, asamblatorul salvează o variabilă specială în timpul asamblarii numită Instruction Location Counter (ILC) La începutul primei treceri, această variabilă este setată la și este incrementată după fiecare comandă procesată de lungimea acelei comenzi Lista arată exemplul Pentium corespunzător (penultima coloană a câmpului de comentariu arată lungimea fiecărei instrucțiuni, iar ultima coloană arată valoarea contorului acumulată) În acest exemplu, instrucțiunile până la eticheta MARI A ocupă de octeți Nu vom da exemple pentru SPARC și Motorola, deoarece diferențele dintre limbajele de asamblare nu sunt foarte importante și un exemplu este suficient În plus, după cum ați văzut deja, asamblatorul SPARC este complet ilizibil Lista - - Contorul de adrese de instrucțiuni ține evidența adreselor de instrucțiuni MARIA: MOV EAX, I EAX = I MOV EVH J EBX = J ROBERTA: MOV ECX, K ECX = K IMUL EAX EAX EAX \u d I * I IMUL EBX, EBX EBX = J * J IMUL ECX, ECX ECX = K * K MARILYN: Adăugați EAX, EBX EAX = I * I + J * J Adăugați EAX, ECX EAX = I * I + J * J + K * K STEPHANY: JMP DONE trece la DONE proces de asamblare La prima trecere, majoritatea asamblatorilor folosesc cel puțin tabele: tabelul de simboluri, tabelul de directive și tabelul de coduri operaționale Dacă este necesar, se folosește și un tabel literal Tabelul cu nume simbolice conține o intrare pentru fiecare nume, așa cum se arată în Tabelul Numele simbolice sunt fie etichete, fie definite în mod explicit (de exemplu, folosind directiva EQU) Fiecare element al tabelului de nume simbolice conține numele în sine (sau un indicator către acesta), valoarea sa numerică și uneori câteva informații suplimentare Poate include: + lungimea câmpului de date asociat caracterului; + biți de realocare a memoriei (care indică dacă valoarea simbolului se va schimba dacă programul este încărcat la o altă adresă decât asamblatorul intenționat să-l încarce); + informații despre dacă simbolul poate fi accesat din afara procedurii Tabelul , Tabelul numelor simbolice ale programului din Lista Nume simbolic Semnificație Alte informații MARIA ROBERTA MARILYN STEFANIA Tabelul de coduri operaționale are cel puțin o intrare pentru fiecare cod operațional de asamblare simbolică (Tabelul ) Fiecare intrare conține un cod operațional de caractere, doi operanzi, valoarea numerică a codului operațional, lungimea instrucțiunii și un număr de tip care poate fi utilizat pentru a determina grupului căruia îi aparține codul operațional (codurile operaționale sunt împărțite în grupuri în funcție de număr și tip de operanzi) Tabelul - Mai multe elemente ale tabelului de coduri operaționale a asamblatorului Pentium Opcode Primul operand Al doilea operand Cod hexadecimal Lungime comandă Clasa de comandă AAA - - ADAUGĂ EAX immed ADĂUGAȚI regul SI EAX immed ȘI regul Ca exemplu, luați în considerare opcode-ul ADD Dacă primul operand al instrucțiunii ADD este registrul EAX, iar al doilea operand este o constantă de de biți (immed ), atunci se folosește codul operațional x , iar lungimea instrucțiunii este de octeți Dacă ambii operanzi ai unei instrucțiuni ADD sunt registre, instrucțiunea are octeți și codul operațional este x Toate combinațiile de opcode și operanzi care Capitolul Nivel de asamblare respectă această regulă, sunt clasa și sunt procesate în același mod ca instrucțiunea ADD cu două registre ca operanzi O clasă de comandă identifică o procedură care este apelată pentru a procesa toate comenzile de un anumit tip În unele asamblatoare, este posibil să scrieți instrucțiuni folosind adresarea directă, chiar dacă instrucțiunea corespunzătoare nu este în limba țintă Astfel de comenzi cu adrese "pseudo-imediate" sunt procesate după cum urmează Asamblatorul atribuie o zonă de memorie operandului imediat la sfârșitul programului și generează o instrucțiune care îl accesează De exemplu, mainframe-ul IBM nu are comenzi cu adrese directe Cu toate acestea, pentru a încărca constanta cu cuvânt complet în registrul , programatorul poate scrie comanda: L =F' ' Astfel, programatorul nu trebuie să scrie o directivă pentru a plasa un cuvânt în memorie, să-i dea valoarea , să-i dea o etichetă și apoi să folosească acea etichetă într-o instrucțiune L Constanțele pentru care asamblatorul le alocă automat memorie sunt numite literale Literale fac un program mai ușor de citit și de înțeles, făcând evident semnificația unei constante în enunțul original La prima trecere, asamblatorul trebuie să creeze un tabel cu toate literalele care sunt utilizate în program Toate cele trei computere pe care le-am luat drept exemple au instrucțiuni cu adrese imediate, astfel încât asamblorii lor nu acceptă literale Comenzile cu adrese imediate sunt acum considerate destul de comune, deși înainte erau considerate ceva complet exotic Poate că popularitatea literalilor i-a convins pe dezvoltatori că adresarea directă este o idee foarte bună Dacă sunt necesare literali, atunci în timpul asamblarii este stocat un tabel de literali în care apare un nou element de fiecare dată când este întâlnit un literal După prima trecere, tabelul este sortat și elementele duplicat sunt eliminate Lista arată mecanismul din spatele primei treceri de asamblare Numele comenzilor sunt alese în așa fel încât esența lor să fie clară Această listă este un bun punct de plecare pentru învățarea adunării Este destul de scurt, de înțeles și arată care ar trebui să fie următorul pas - aceasta este scrierea procedurilor care sunt menționate în această listă Lista Prima trecere a asamblatorului simplu public static void pass one() { // Această procedură este prima trecere a asamblatorului boolean morejnput=true; // steag care oprește prima trecere String line, simbol, literal, opcode; // câmpuri de comandă int locație counter, lungime, valoare, tip: // variabile final int END STATEMENT = - ; // sfârșitul semnalelor de intrare locație counter= ; // asamblarea primei comenzi din celula O initialize tables(); // inițializare generală // morejnput folosind directiva END // obține valoarea "false" în timp ce (mai multă intrare) { proces de asamblare line = read nextjine(): lungime = ; tip= ; // citește șirul // # octet în comandă // tipul comenzii if (linejs not comment(line)) { simbol = check for symbol(line); dacă (simbol != nul) // șirul conține o etichetă? // dacă da, atunci // caracterul și valoarea sunt scrise enter new symbol(simbol, locație counter); literal = check for literal( ine); // șirul conține un literal? if (literal != nulli) // dacă da, atunci it // stocat în tabel enter new literal(literal): // Acum definim tipul de opcode - înseamnă opcode invalid opcode = extract opcode(line); // determină locația codului de operare tip=search opcode table(opcode); // găsiți formatul, // de exemplu, OP REG REG if (type | Maarten | [ ~ ->| Wiebern | | Frank | | Eu-I Gerrit | | I-H Cathy | | ~I~N Willem I [ D>| Dick I | Anton | | Eric | | Orez Hashing: nume simbolice, valori și coduri hash derivate din nume simbolice (a); tabel hash de elemente cu o listă legată de nume și valori simbolice (b) Capitolul Nivel de asamblare Conectare și descărcare Majoritatea programelor conțin mai multe proceduri Compilatorii și asamblatorii traduc o procedură și scriu rezultatul pe disc Înainte de a rula programul, toate procedurile compilate trebuie găsite și legate Dacă memoria virtuală nu este disponibilă, programul legat trebuie încărcat direct în memoria principală Programele care îndeplinesc aceste funcții sunt numite variat: linkeri, încărcătoare de linkuri, linkere Traducerea completă a programului sursă necesită doi pași (Figura ): Compilarea sau asamblarea procedurilor sursă Aranjarea modulelor obiect Primul pas este efectuat de către asamblator sau compilator, al doilea de către linker Orez Pentru a obține un program binar executabil dintr-un set de proceduri traduse independent, se folosește un linker Traducerea unei proceduri sursă într-un modul obiect este un pas înainte, deoarece limbile sursă și țintă au comenzi și sintaxă diferite Cu toate acestea, la conectarea, nu există nicio tranziție la un alt nivel, deoarece programele din și din linker sunt pentru aceeași mașină virtuală Scopul linkerului este de a lega împreună toate procedurile care au fost traduse separat, astfel încât rezultatul să fie un cod binar executabil Pe sistemele MS-DOS, Windows / și Windows NT, modulele obiect au extensia obj, iar programele executabile au extensia exe În UNIX, modulele obiect au extensia o, dar programele executabile nu Compilatorii și asamblatorii traduc fiecare procedură sursă ca o unitate separată Există un motiv bun pentru asta Dacă un compilator sau un asamblator citește o serie întreagă de proceduri sursă și le traduce imediat într-un program de limbaj mașină terminat, atunci schimbarea unei declarații în procedura sursă ar necesita retraducerea tuturor procedurilor sursă Conectare și descărcare Dacă fiecare procedură este tradusă separat, așa cum se arată în Fig , ar trebui retradusă o singură procedură modificată, deși toate modulele obiect ar trebui reconectate Cu toate acestea, legarea este mult mai rapidă decât traducerea, așa că atunci când rafinați un program, ambii pași (traducere și legare) sunt rapidi Acest lucru este deosebit de important pentru programele care conțin sute sau mii de module Sarcini de linker La începutul primei treceri de asamblare, contorul de adrese de instrucțiune este setat la Acest pas este echivalent cu presupunerea că modulul obiect va fi în locația în timpul execuției Figura prezintă module obiect pregătite pentru o mașină tipică În acest exemplu, fiecare modul începe cu o instrucțiune de ramificare BRANCH la o instrucțiune MOVE în același modul Orez Fiecare modul are propriul său spațiu de adrese, începând cu adresa zero Pentru a putea rula programul, linkerul plasează module obiect în memoria principală, formând o imagine a codului binar executabil (Fig , a) Scopul este de a crea o imagine exactă a spațiului virtual de adrese Capitolul Nivel de asamblare program executabil în interiorul linkerului și plasați toate modulele obiect la adresele corespunzătoare Dacă nu există suficientă memorie fizică sau virtuală pentru a forma imaginea, se poate folosi un fișier de disc De obicei, o mică secțiune de memorie care începe de la adresa zero este utilizată pentru vectorii de întrerupere, interacțiunea cu sistemul de operare, detectarea pointerilor neinițializați și alte scopuri, astfel încât, de regulă, programele nu încep la adresa zero, ci mai sus În exemplul nostru, programele încep la adresa Uită-te la fig , a Deși programul a fost deja încărcat în imaginea binară executabilă, nu este încă gata de rulare Să vedem ce se întâmplă dacă programul începe cu instrucțiunea de la începutul modulului A Programul nu va sări la instrucțiunea MOVE deoarece această instrucțiune este situată în locația De fapt, toate instrucțiunile de acces la memorie nu vor fi executate pentru aceeași motiv Aici intervine problema realocării memoriei, deoarece fiecare modul obiect din figură ocupă propriul spațiu de adrese Pe o mașină cu un spațiu de adrese segmentat (cum ar fi Pentium ), fiecare modul de obiect ar putea avea, teoretic, propriul spațiu de adrese dacă este plasat într-un segment separat Cu toate acestea, pentru Pentium , numai OS/ acceptă această structură Toate versiunile de Windows și UNIX acceptă același spațiu de adrese liniar, astfel încât toate modulele obiect trebuie să fie combinate în același spațiu de adrese Mai mult, procedura de apelare a comenzilor din Fig , dar nu va funcționa deloc La locația , programatorul intenționează să apeleze modulul obiect B, dar pentru că fiecare procedură este tradusă separat, asamblatorul nu poate determina ce adresă să insereze în instrucțiunea CALL B deoarece adresa modulului obiect B nu este cunoscută înainte de conectare Această problemă se numește problema de referință externă Ambele probleme sunt rezolvate folosind linker-ul Linker-ul combină spațiile de adrese ale modulelor obiect individuale într-un singur spațiu de adrese liniar Pentru aceasta se fac urmatorii pasi: Linkerul construiește un tabel cu module de obiecte și dimensiunile acestora Pe baza acestui tabel, atribuie adrese de pornire fiecărui modul obiect Linker-ul găsește toate instrucțiunile care accesează memoria și adaugă fiecăruia dintre ele o constantă de realocare egală cu adresa de pornire a acelui modul Trebuie remarcat faptul că metoda de organizare a segmentelor a fost folosită numai în prima versiune de OS / , care era pe biți și a fost dezvoltată pentru microprocesorul Prin urmare, nu pare chiar corect să atribuiți acest sistem Pentium Din , toate versiunile ulterioare de OS/ au fost pe de biți și, ca și alte sisteme de operare moderne, nu acceptă sharding, ci folosesc doar mecanismul de paginare - Notă științific ed Conectare și descărcare MUTAȚI S LA X SUCURSALA LA Apelați RTOX-UL MEU SUCURSALA LA Apelați Q MEU LA X SUCURSALA LA SUNĂ PTOX-ul meu SUCURSALA LA A Modulul obiect D Modulul obiect C Modulul obiect B Modulul obiect A MUTAȚI S LA X SUCURSALA LA Sunați la RTOX-UL MEU SUCURSALA LA Sunați la Q MEU LA X SUCURSALA LA eu , SUNAȚI LA MĂ MUSC RTO X i SUCURSALA LA eu i b Modulul obiect A Modulul obiect C Modulul obiect B Obiectul l modulul D Orez Module obiect după plasarea în imaginea binară, dar înainte de realocarea memoriei și legarea (a); aceleași module obiect după conectarea și realocarea memoriei (b) Rezultatul este un binar executabil care poate fi rulat Capitolul Nivel de asamblare Linker-ul găsește toate instrucțiunile care apelează proceduri și inserează adresele acestor proceduri în ele Tabelul corespunde tabelului modulelor obiect construite la prima etapă, prezentată în fig Acesta oferă numele, lungimea și adresa de pornire a fiecărui modul Pe fig Figura - b arată cum arată spațiul de adrese după ce linkerul a terminat de rulat Tabelul Numele, lungimea și adresa de început ale fiecărui modul din fig Lungimea modulului Adresa de pornire A B C D Structura modulului obiect Modulele obiect constau de obicei din șase părți: Identificare Tabelul punctelor de intrare Tabel de legături externe Comenzi și constante ale mașinii Redistribuirea vocabularului Sfârșitul modulului Prima parte conține numele modulului, unele informații de care are nevoie linkerul (cum ar fi lungimea diferitelor părți ale modulului) și uneori data asamblarii A doua parte a unui modul obiect este lista de simboluri definite în modul, împreună cu valorile acestora Aceste simboluri pot fi accesate de alte module De exemplu, dacă modulul constă din procedura bigbug, atunci elementul tabelului va conține șirul de caractere "bigbug" cu adresa corespunzătoare Un programator de limbaj de asamblare folosește directiva PUBLIC pentru a specifica ce nume simbolice sunt considerate puncte de intrare A treia parte a unui modul obiect constă dintr-o listă de nume simbolice care sunt utilizate în acest modul și sunt definite în alte module Există, de asemenea, o altă listă aici care arată exact ce nume simbolice sunt folosite de către ce instrucțiuni de mașină A doua listă este necesară pentru ca linkerul să poată introduce adresele corecte în comenzile care folosesc nume externe O procedură poate apela alte proceduri traduse independent prin declararea numelor procedurilor apelate ca fiind externe Un programator în limbaj de asamblare folosește directiva EXTERN pentru a specifica ce simboluri să declare ca externe Pe unele computere, punctele de intrare și xref-urile sunt combinate în același tabel Conectare și descărcare A patra parte a modulului obiect este instrucțiunile și constantele mașinii Aceasta este singura parte a modulului obiect care este încărcată în memorie pentru execuție Cele cinci părți rămase sunt folosite de linker și apoi aruncate înainte ca programul să înceapă chiar să se execute A cincea parte a modulului obiect este dicționarul de realocare a memoriei O constantă de realocare trebuie adăugată la instrucțiunile care conțin adrese de memorie (vezi Figura ) Linker-ul în sine nu poate determina care cuvinte din partea conțin instrucțiuni de mașină și care sunt constante Prin urmare, acest tabel conține informații despre adresele care trebuie realocate Acesta poate fi un tabel de biți, în care fiecare bit are o adresă potențial remapată sau o listă explicită de adrese remapate A șasea parte conține o indicație a sfârșitului modulului și, uneori, o sumă de control pentru a determina erorile făcute în timpul citirii modulului și adresa de la care ar trebui să înceapă execuția Cele mai multe linkere necesită două treceri La prima trecere, linkerul citește toate modulele obiect și construiește un tabel cu nume și dimensiuni ale modulelor, precum și un tabel global de simboluri, care constă din toate punctele de intrare și referințele externe La a doua trecere, modulele sunt citite unul câte unul, realocate în memorie și asamblate Timp de legătură și realocare dinamică a memoriei Într-un sistem multiprogram, un program poate fi citit în memoria principală, rulat pentru un timp, scris pe disc și apoi citit înapoi în memoria principală pentru execuție Într-un sistem complex cu multe programe, este dificil să fii sigur că programul este citit în același loc în memorie de fiecare dată Pe fig Figura arată ce se întâmplă dacă un program deja alocat (vezi Figura b) este încărcat la adresa mai degrabă decât la adresa , acolo unde linkerul l-a plasat inițial Toate adresele de memorie se dovedesc a fi greșite, iar acest lucru se întâmplă în absența oricărei informații despre alocarea memoriei Chiar dacă aceste informații ar fi disponibile, ar fi o risipă să redistribuim toate adresele de fiecare dată când programul este încărcat Problema deplasării programelor deja legate și plasate în memorie este direct legată de momentul legării finale a numelor simbolice de adrese absolute ale memoriei fizice Programul conține nume simbolice pentru adresele de memorie (de exemplu, BR L) Momentul la care este determinată adresa din memoria principală corespunzătoare numelui L se numește timp de legare Există cel puțin șase timpi de legare: Când se scrie programul Când programul este difuzat Când programul se conectează, dar înainte de încărcare Capitolul Nivel de asamblare Când programul este încărcat Când este încărcat registrul de bază, care este folosit pentru adresare Când se execută o comandă care conține adresa necesară Dacă o instrucțiune care conține o adresă este remapată în memorie după ce a fost legată, acea adresă este invalidă (presupunând că obiectul referit este, de asemenea, mutat în memorie) Dacă compilatorul generează cod binar executabil, atunci legătura are loc în timpul traducerii, iar programul trebuie rulat de la adresa specificată de traducător Folosind metoda descrisă în subsecțiunea anterioară, numele simbolice sunt asociate cu adrese absolute în timpul conectării, motiv pentru care programele nu pot fi mutate după legare (vezi Figura ) Sunt două întrebări aici În primul rând, când sunt asociate numele simbolice cu adrese virtuale? În al doilea rând, când sunt asociate adresele virtuale cu adresele fizice? Numai după aceste două operații, procesul de legare poate fi considerat finalizat Când linker-ul îmbină spații de adrese separate ale modulelor obiect într-un singur spațiu de adrese liniar, acesta creează de fapt un spațiu de adrese virtual Remapările și legarea memoriei sunt necesare pentru a asocia nume simbolice cu adrese virtuale specifice Acest lucru este valabil indiferent dacă se utilizează sau nu memoria virtuală Să presupunem că spațiul de adrese prezentat în Fig , b, a fost paginat Este clar că adresele virtuale corespunzătoare denumirilor simbolice A, B, C D sunt deja definite, deși adresele lor fizice vor depinde de conținutul tabelului de pagini În realitate, legarea numelor simbolice de adrese virtuale are loc în codul binar executabil Orice mecanism care facilitează schimbarea mapării adreselor virtuale la adrese din memoria fizică principală va facilita mutarea unui program în memoria principală, chiar dacă acestea sunt deja asociate cu un spațiu de adrese virtuale Un astfel de mecanism este paginarea Dacă un program este mutat în memoria principală, trebuie schimbat doar tabelul de pagini, nu programul în sine Al doilea mecanism este utilizarea registrului de realocare a timpului de execuție Calculatorul CDC și succesorii săi conțineau un astfel de registru Pe mașinile care utilizează această tehnică de remapare a memoriei, registrul indică întotdeauna adresa fizică a începutului programului curent În hardware, acest registru este adăugat la toate adresele înainte ca acestea să fie alocate în memorie Întregul proces de realocare a memoriei este transparent pentru programele utilizatorului Programele utilizatorului nici măcar nu bănuiesc că memoria este realocata Dacă programul este mutat, sistemul de operare trebuie să actualizeze registrul de realocare Acest mecanism este mai puțin comun decât paginarea, deoarece întregul program trebuie mutat (dacă există registre separate de realocare pentru cod și date, ca, de exemplu, în procesorul Intel , atunci ambele părți ale programului vor fi obiecte mutate) Conectare și descărcare MUTAȚI S LA X SUCURSALA LA Sunați la MUTAȚI R LA X SUCURSALA LA Sunați la Q MEU LA X SUCURSALA LA Sunați la MUTAȚI RTO X SUCURSALA LA Modulul obiect D Modulul obiect C Modulul obiect B Modulul obiect A Orez Programul executabil din fig , b, deplasat în sus cu de adrese Multe comenzi accesează acum adresele de memorie greșite Al treilea mecanism poate fi utilizat în mașinile care implementează capacitatea de a accesa memorie în raport cu contorul de programe În aceste mașini, ori de câte ori un program este mutat în memoria principală, este suficient să se actualizeze Capitolul Nivel de asamblare numai contorul de programe Un program, ale cărui accesuri la memorie sunt fie asociate cu contorul de programe, fie sunt absolute (de exemplu, accesări la registrele dispozitivelor I/O prin adrese absolute), se numește independent de poziție O procedură independentă de poziție poate fi plasată oriunde în spațiul de adrese virtuale fără a fi necesară realocarea adreselor de memorie Legătura dinamică Strategia de legare despre care am discutat în subsecțiunea Sarcini de legătură are o caracteristică: toate procedurile cerute de program sunt legate înainte de începerea programului Totuși, dacă stabilim toate conexiunile înainte ca programul să înceapă să ruleze într-un computer cu memorie virtuală, atunci nu folosim toate posibilitățile memoriei virtuale Multe programe conțin proceduri care sunt apelate numai în anumite circumstanțe De exemplu, compilatoarele conțin proceduri pentru compilarea declarațiilor rar utilizate sau pentru remedierea erorilor rare O modalitate mai flexibilă de a lega procedurile compilate separat este de a lega fiecare procedură în momentul în care este apelată pentru prima dată Acest proces se numește legătură dinamică A fost folosit pentru prima dată în sistemul MULTICS Să ne uităm la exemple de legături dinamice pe mai multe sisteme Legături dinamice în MULTICS În sistemul MULTICS, fiecare program este asociat cu un segment, așa-numitul segment de legătură Conține un bloc de informații pentru fiecare procedură care poate fi apelată Acest bloc începe cu un cuvânt rezervat pentru adresa virtuală a procedurii, urmat de numele procedurii, care este stocat ca șir de caractere În legarea dinamică, apelurile de procedură în limba gazdă sunt traduse în instrucțiuni care, prin adresare indirectă, se referă la primul cuvânt al blocului corespunzător, așa cum se arată în Fig , a Compilatorul completează acest cuvânt fie cu o adresă invalidă, fie cu un set special de biți care provoacă o excepție Când este apelată o procedură dintr-un alt segment, o încercare de a se referi indirect la un cuvânt invalid generează o excepție de linker Linkerul găsește apoi șirul de caractere din cuvântul care urmează adresei greșite și începe să caute în directorul utilizatorului procedura compilată cu numele găsit Această procedură primește apoi o adresă virtuală (de obicei în propriul segment), iar această adresă virtuală este suprascrisă cu adresa greșită, așa cum se arată în Figura - b Comanda care a provocat eroarea de legătură este apoi re-execută, permițând programului să continue unde era înainte de excepție Toate apelurile ulterioare la această procedură vor rula fără eroare, deoarece cuvântul anterior nevalid conține acum adresa virtuală corectă Prin urmare, cu legătura dinamică, linkerul este apelat numai atunci când procedura este apelată pentru prima dată Nu trebuie să-l suni din nou Conectare și descărcare b Orez Legătura dinamică: procedură EARTH înainte de apel (a); Procedura EARTH după apel și legătură (b) Legături dinamice în Windows Toate versiunile de Windows, inclusiv Windows NT, acceptă legătura dinamică Legătura dinamică utilizează un format de fișier special numit DLL (Dynamic Link Library) Capitolul Nivel de asamblare legătură dinamică) Bibliotecile de legături dinamice pot conține proceduri, date sau ambele De obicei, acestea sunt utilizate pentru a permite două sau mai multe procese să partajeze procedurile și datele unei biblioteci Majoritatea fișierelor DD L au extensia dll, dar există și alte extensii, precum drv (pentru bibliotecile de drivere - biblioteci de drivere) și fon (pentru bibliotecile de fonturi - biblioteci de fonturi) Cea mai comună formă de DLL este o bibliotecă, care constă dintr-un set de proceduri care pot fi încărcate în memorie și accesate de mai multe procese în același timp Figura prezintă două procese care partajează un fișier DLL care conține proceduri, L, B, C și D Programul utilizează procedura L; programul este procedura C, deși ar putea foarte bine să folosească aceeași procedură Utilizator Utilizator procesul procesul Orez Două procese au același DLL Fișierul DLL este creat de linker dintr-un grup de fișiere de intrare Construirea unui DDL este similară cu construirea unui binar executabil, doar când DLL-ul este construit, un steag special este transmis linker-ului pentru a indica faptul că DLL-ul este necesar Fișierele DLL sunt de obicei construite dintr-un set de rutine de bibliotecă de care pot avea nevoie mai multe procese Exemple comune de DLL-uri sunt interfețele pentru biblioteca de apeluri de sistem Windows și bibliotecile grafice mari Folosind fișiere DDL, economisim spațiu în memorie și pe disc Dacă o anumită bibliotecă ar fi legată static la fiecare program care a folosit-o, acea bibliotecă ar trebui inclusă în toate binarele executabile din memorie și pe disc, ceea ce nu este economic Și dacă există un fișier DLL, va exista o singură bibliotecă pe disc și în memorie Conectare și descărcare În plus, această abordare facilitează actualizarea rutinelor bibliotecii, chiar și după ce programele care le folosesc au fost compilate și legate Pentru pachetele software comerciale în care programul de intrare nu este în mod normal disponibil pentru utilizatori, prezența fișierelor DLL înseamnă că furnizorul de software poate remedia erorile software detectate prin simpla distribuire de noi fișiere DLL pe Internet, fără a necesita modificări ale fișierelor binare ale principalelor programe Principala diferență dintre un DLL și un program binar executabil este că un fișier DLL nu poate rula și rula singur (deoarece nu are un program principal) De asemenea, conține informații complet diferite în antet În plus, fișierul DLL are mai multe proceduri suplimentare care nu au legătură cu procedurile din bibliotecă De exemplu, există o procedură care este apelată automat ori de câte ori un proces nou se conectează la un fișier DLL și o altă procedură care este apelată automat ori de câte ori un proces se leagă la un fișier DLL Aceste rutine pot aloca și dezaloca memorie sau gestiona alte resurse de care DLL-ul are nevoie Un program se poate conecta la un fișier DLL în două moduri: prin legare implicită sau explicită Cu legături implicite, programul utilizatorului este legat static la un fișier special, așa-numita bibliotecă de import O bibliotecă de import este creată de un utilitar special conceput pentru a extrage anumite informații dintr-un fișier DLL Biblioteca de import oferă o legătură prin care programul utilizatorului poate accesa fișierul DLL Un program utilizator poate fi conectat la mai multe biblioteci de import Când un program care este legat implicit este încărcat în memorie pentru execuție, Windows verifică ce DLL-uri are nevoie și dacă acestea sunt toate în memorie Acele fișiere care nu sunt încă în memorie sunt încărcate acolo imediat (dar nu neapărat în întregime, deoarece sunt paginate) Apoi, anumite modificări sunt aduse structurilor de date din bibliotecile de import, astfel încât să poată fi determinată locația procedurilor apelate (similar cu modificările ilustrate în Figura ) De asemenea, ele trebuie mapate la spațiul de adrese virtuale al programului Din acest moment, programul utilizator poate fi rulat deoarece poate apela proceduri din fișierele DLL ca și cum ar fi legate static la acesta O alternativă la legarea implicită este legătura explicită Legătura explicită nu necesită nicio bibliotecă de import sau încărcarea simultană a fișierelor DLL cu programul utilizatorului În schimb, programul utilizator efectuează un apel explicit în timpul execuției pentru a se conecta la DLL și apoi face apeluri suplimentare pentru a obține adresele procedurilor de care are nevoie Când toate acestea sunt făcute, programul face un apel final pentru a rupe legătura cu fișierul DLL Când ultimul proces întrerupe legătura cu un fișier DLL, acel fișier poate fi descărcat din memorie Capitolul Nivel de asamblare Este important să înțelegeți că o procedură dintr-un fișier DLL nu are caracteristici distinctive (cum ar fi procese sau fire de execuție) Se rulează pe firul programului apelant și folosește stiva programului apelant pentru variabilele locale Poate conține date statice specifice procesului (precum și date generale), dar altfel funcționează ca o procedură legată static Singura diferență semnificativă este modul în care este stabilită conexiunea Legături dinamice în UNIX UNIX utilizează biblioteci partajate care sunt în esență similare cu DLL-urile Windows La fel ca un fișier DLL, o bibliotecă de acces partajat este un fișier de arhivă care conține mai multe proceduri sau module de date care sunt prezente în memorie în timp ce un program rulează și poate fi asociat cu mai multe procese în același timp Biblioteca standard C și majoritatea programelor de rețea sunt biblioteci partajate UNIX acceptă numai legături implicite, astfel încât biblioteca de acces partajat constă din două părți: biblioteca gazdă, care este legată static la executabil, și biblioteca țintă, care este apelată în timpul execuției În ciuda unor diferențe în detaliu, conceptul este în esență același cu conceptul DLL Rezumatul capitolului Deși majoritatea programelor pot și ar trebui să fie scrise în limbaje de nivel înalt, există situații în care limbajul de asamblare trebuie folosit, cel puțin parțial Acestea pot include programe pentru calculatoare cu resurse insuficiente (de exemplu, procesoare pentru carduri inteligente, diverse dispozitive, dispozitive digitale portabile) Un program de asamblare este o reprezentare simbolică a unui program într-un anumit limbaj de mașină Este tradus în limbajul mașinii printr-un program special numit assembler Dacă o aplicație necesită performanțe ridicate, cel mai bine este să scrieți mai întâi programul într-un limbaj de nivel înalt, apoi prin teste pentru a determina care parte a programului durează cel mai mult timp pentru a fi executată și să rescrieți numai aceste părți ale programului în asamblator Practica arată că adesea o mică parte din întregul program ocupă cea mai mare parte a întregului timp de execuție al acestui program Mulți asamblatori oferă macrocomenzi care permit programatorilor să dea nume simbolice secvențe întregi de instrucțiuni De obicei, aceste macrocomenzi pot fi parametrizate Macro-urile sunt implementate folosind un algoritm de procesare literală a șirului Întrebări și sarcini Majoritatea asamblatorilor sunt cu două treceri În timpul primei treceri, este construit un tabel de simboluri pentru etichete, literale și identificatori declarați Numele simbolice pot fi fie nesortate și căutate prin scanare secvenţială de tabel, fie sortate mai întâi, apoi se aplică căutarea binară sau hashing Dacă numele simbolice nu trebuie să fie eliminate în timpul primei treceri, hashing este cea mai bună metodă Programul executabil este creat în timpul celei de-a doua treceri În ceea ce privește directivele (pseudo-comenzi), unele dintre ele sunt executate în timpul primei treceri, altele - în timpul celei de-a doua Programele care se asamblează independent unele de altele pot fi legate între ele pentru a forma un program binar executabil Această lucrare este realizată de linker Scopul său este realocarea memoriei și legarea numelor Legătura dinamică este o tehnică în care anumite proceduri nu sunt legate până când sunt apelate Bibliotecile partajate pe UNIX și bibliotecile cu linkuri dinamice (DLL) pe Windows folosesc tehnologia linkurilor dinamice Întrebări și sarcini Doar % din codul programului este responsabil pentru % din timpul de execuție al acestui program Comparați următoarele trei strategii în ceea ce privește programarea și timpul de execuție Să presupunem că este nevoie de de luni-om pentru a scrie un program C, dar că un program în limbaj de asamblare este de ori mai greu de scris, dar funcționează de ori mai eficient ) Întregul program este scris în C ) Întregul program este scris în assembler ) Programul este mai întâi scris în C, iar apoi % necesar din program este rescris în assembler Există anumite convenții pentru asamblatorii cu două treceri De asemenea, ar putea fi potrivite pentru următoarele compilatoare: ) Compilatorul generează module obiect în loc de codul de asamblare? ) Compilatorul generează limbaj de asamblare simbolic? Toți asamblatorii pentru procesoarele Intel primesc adresa țintă ca prim operand și adresa sursă ca al doilea Ce probleme ar putea apărea cu o abordare diferită? Următorul program poate fi asamblat în două treceri? EQU este o directivă care echivalează o etichetă cu o expresie dintr-un câmp operand A EQU B B EQU C CU EQU D DEQU Capitolul Nivel de asamblare O companie plănuiește să dezvolte un asamblator pentru un computer cu un cuvânt de de biți Pentru a reduce costurile, managerul de proiect a decis să limiteze lungimea numelor simbolice, astfel încât fiecare nume să poată fi stocat într-un singur cuvânt Managerul a anunțat că numele simbolice pot consta doar din litere, cu litera Q interzisă Care este lungimea maximă a unui nume simbolic? Descrieți schema dvs de codare Care este diferența dintre o comandă și o directivă? Cum este diferit contorul de adrese de comandă de contorul de comenzi? Există vreo diferență între ele? La urma urmei, ambii efectuează urmărirea următoarei comenzi din program Care va fi tabelul de simboluri (nume) după procesarea următoarelor instrucțiuni de asamblare Pentium (adresa este atribuită primei instrucțiuni)? EVEREST: POP BX ; ( octet) K : PUSH BP ; ( octet) WHITNEY: MOV BP SP ; ( octeți) MCKINLEY: PUSH X: ( octeți) FUJI: PUSH SI ; ( octet) KIBO: SUB SI, ; ( octeți) Vă puteți imagina circumstanțe în care o etichetă s-ar potrivi cu un cod operațional (de exemplu, ar putea fi folosită o instrucțiune MOV ca etichetă)? Argument Ce pași trebuie să faceți pentru căutarea binară pentru a găsi elementul "Berkeley" în următoarea listă: Ann Arbor, Berkeley, Cambridge, Eugene, Madison, New Haven, Palo Alto, Pasadena, Santa Cruz, Stony Brook, Westwood , Izvoarele Galbene Când calculați elementul din mijloc într-o listă cu un număr par de elemente, luați elementul care vine imediat după cel din mijloc I Este posibil să se utilizeze o căutare binară pe un tabel care conține un număr prim de elemente? Calculați codul hash pentru fiecare dintre următoarele nume simbolice Pentru a face acest lucru, adunați literele (a = , b = etc ) și luați rezultatul modulo dimensiunea tabelului hash Tabelul hash conține sloturi (de la la ) els, jan, jelle, maaike Fiecare nume simbolic formează o valoare hash unică? Dacă nu, cum poate fi rezolvat acest conflict? Metoda hash descrisă în textul capitolului vă permite să aranjați toate elementele care au același cod hash într-o listă legată O metodă alternativă este de a avea un singur tabel de n sloturi, cu spațiu în fiecare slot pentru o cheie și valoarea acesteia (sau pentru pointerii către acestea) Dacă algoritmul de hashing generează un slot care este deja plin, se face o a doua încercare folosind același algoritm de hashiro Întrebări și sarcini vanitate Dacă de data aceasta slotul este plin, algoritmul este aplicat din nou și așa mai departe Aceasta continuă până când este găsit un slot gol Dacă proporția de sloturi care sunt deja umplute este R, de câte încercări vor fi necesare în medie pentru a introduce un nou simbol în tabel? Probabil cândva în viitor va fi posibil să puneți mii de procesoare identice pe un singur cip, fiecare dintre ele conține mai multe cuvinte de memorie locală Dacă toate procesoarele pot citi și scrie trei registre comune, atunci cum se implementează memoria asociativă? Pentium are o arhitectură segmentată Segmentele sunt independente Asamblatorul pentru această mașină ar putea conține o directivă SEG N care pune codul și datele ulterioare în segmentul N Ar afecta o astfel de schemă contorul de adrese de instrucțiuni? Programele sunt adesea legate de numeroase DLL-uri Nu ar fi mai eficient să puneți toate procedurile într-un fișier DLL mare și apoi să îl conectați? Este posibil să mapați un fișier DLL la spațiile de adrese virtuale ale două procese cu adrese virtuale diferite? Dacă da, care sunt problemele? Pot fi rezolvate? Dacă nu, ce se poate face pentru a le elimina? Să descriem una dintre metodele de legare (legare statică) Înainte de a scana biblioteca, linkerul face o listă de proceduri necesare, adică nume care sunt definite ca EXTERN în modulele care sunt legate Linkerul parcurge apoi întreaga bibliotecă unul câte unul, extragând fiecare procedură care se află în lista de nume dorite Va funcționa o astfel de schemă? Dacă nu, de ce nu și cum se poate remedia? Poate fi folosit un registru ca parametru real într-un apel macro? Dar o constantă? Dacă da, de ce? Dacă nu, de ce nu? Trebuie să implementați un macro-asamblator Din motive estetice, șeful tău a decis că definițiile macro nu ar trebui să precedă apelurile macro Cum va afecta această decizie implementarea? Gândiți-vă cum puteți pune macro-asamblatorul într-o buclă infinită Linkerul citește module de , , , și respectiv de cuvinte Dacă sunt încărcate în această ordine, atunci care sunt constantele de realocare a memoriei? Scrieți un modul de tabel de simboluri format din două proceduri: introducere (simbol, vaiiee) și căutare (simbol, valoare) Primul introduce noi nume simbolice în tabel, iar al doilea le caută în tabel Utilizați o opțiune de hashing Capitolul Nivel de asamblare Scrieți un asamblator simplu pentru computerul Mic- , despre care am discutat în capitolul Pe lângă operarea cu instrucțiunile mașinii, oferiți capacitatea de a atribui constante numelor simbolice în timpul asamblarii, precum și capacitatea de a asambla o constantă în un cuvânt de mașină Adăugați macrocomenzi la asamblatorul pe care ar fi trebuit să le scrieți în sarcina anterioară Capitolul Arhitecturi de computere paralele Viteza computerelor este din ce în ce mai rapidă, dar cerințele impuse acestora sunt în continuă creștere Astronomii încearcă să reproducă întreaga istorie a universului din momentul Big Bang până în zilele noastre Farmacistii ar dori sa dezvolte noi medicamente folosind computere fara a sacrifica legiuni de sobolani Proiectanții de avioane ar putea obține rezultate mai bune dacă, în loc să construiască tuneluri de vânt uriașe, și-ar modela proiectele pe un computer Pe scurt, oricât de puternice sunt computerele, capacitățile lor nu vor fi niciodată suficiente pentru a rezolva multe probleme nebanale (în special științifice, tehnice și industriale) Deși frecvența ceasului crește constant, viteza de comutare nu poate fi mărită la infinit Principala problemă rămâne viteza luminii - este imposibil să faci protonii și electronii să se miște mai repede Datorită disipării mari a căldurii, computerele s-au transformat în aparate de aer condiționat În cele din urmă, pe măsură ce tranzistoarele devin tot mai mici, în cele din urmă va veni un moment în care fiecare tranzistor va fi format din mai mulți atomi, astfel încât legile mecanicii cuantice (cum ar fi principiul incertitudinii lui Heisenberg) pot deveni o problemă majoră Drept urmare, pentru a putea rezolva probleme mai complexe, dezvoltatorii au apelat la calculatoare paralele (denumite în continuare computere paralele) Este imposibil să construiești un computer cu un procesor și un timp de ciclu de , ns, dar este posibil să construiești un computer cu de procesoare, fiecare cu un timp de ciclu de ns Și deși viteza fiecărui procesor în al doilea caz este evident scăzută, teoretic ar trebui să obținem performanța necesară Paralelismul poate fi introdus la diferite niveluri La cel mai de jos nivel, poate fi implementat într-un procesor prin pipelining și o arhitectură superscalară cu mai multe blocuri funcționale Paralelismul ascuns poate fi realizat prin prelungirea semnificativă a cuvintelor din comenzi Prin funcții suplimentare, puteți "învăța" procesorul să proceseze mai multe fire de execuție de program în același timp În cele din urmă, puteți instala mai multe procesoare pe același cip Cu toate acestea, toate aceste tehnici luate împreună pot îmbunătăți performanța de maximum ori în comparație cu soluțiile secvenţiale clasice La nivelul următor, este posibil să se introducă în sistem plăci CPU externe cu capacități de calcul îmbunătățite De obicei, procesoarele plug-in implementează funcții speciale, cum ar fi procesarea pachetelor de rețea, procesarea media, criptografia etc Capitolul Arhitecturi de calculatoare paralele Performanța aplicațiilor specializate datorită acestor funcții poate fi mărită de - ori Pentru a îmbunătăți performanța cu un factor de , sau , mai multe procesoare trebuie reunite și interacționate eficient Acest principiu este implementat sub forma unor sisteme mari multiprocesoare și multicalculatoare (calculatoare cluster) Desigur, combinarea a mii de procesoare într-un singur sistem creează noi probleme care trebuie rezolvate În cele din urmă, recent a devenit posibilă integrarea unor organizații întregi prin intermediul internetului Ca rezultat, se formează grile sau rețele de calcul distribuite slab cuplate Astfel de sisteme abia încep să se dezvolte, dar potențialul lor este foarte mare Când două procesoare sau elemente de procesare sunt în apropiere și fac schimb de cantități mari de date cu întârzieri reduse, ele sunt numite strâns cuplate (strâns cuplate) În consecință, atunci când două procesoare sau elemente de procesare sunt situate departe unul de celălalt și fac schimb de cantități mici de date cu întârzieri mari, ele sunt numite cuplate liber În acest capitol, vom discuta principiile de proiectare pentru aceste forme de paralelism și vom analiza câteva exemple Începând cu sistemele puternic cuplate, care se caracterizează prin paralelism intraprocesor, vom trece treptat la sistemele slab cuplate și, în partea finală a capitolului, vom vorbi despre sisteme de calcul distribuite O gamă aproximativă de subiecte luate în considerare este ilustrată în Fig coprocesor Procesor principal Sisteme puternic cuplate Sisteme slab cuplate a B C D E Orez Paralelismul intraprocesor (a); coprocesor (b); multiprocesor (in); multi computer (g); sistem de calcul distribuit slab cuplat (e) Concurența este în mod constant un subiect fierbinte de discuție, iar acest capitol este neobișnuit de plin de referințe, mai ales la lucrări recente pe această temă Referințe suplimentare la lucrările introductive pot fi găsite în secțiunea relevantă a capitolului Paralelism în CPU Paralelism în CPU O modalitate evidentă de a crește performanța unui cip este de a-l face să efectueze mai multe operațiuni pe unitatea de timp În această secțiune, ne vom uita la unele dintre tehnicile de îmbunătățire a vitezei de paralelism la nivel de cip, cum ar fi paralelismul la nivel de instrucțiuni, multithreading și procesoare multiple pe un cip Toate aceste metode, deși diferite unele de altele, ajută la rezolvarea problemei într-o măsură sau alta Ele sunt legate de principiul de bază - "comprimarea" operațiilor în timp Paralelism la nivel de instruire Paralelismul de nivel scăzut se realizează, în special, prin apelarea mai multor instrucțiuni într-un ciclu de ceas Procesoarele care implementează acest principiu se împart în două categorii: superscalare și VLIW Ambele au fost deja menționate în capitolele anterioare, dar acum este util să repetam acest material Schema procesorului superscalar este prezentată în fig În cele mai comune configurații, o instrucțiune trebuie să fie gata pentru execuție la un anumit punct al conductei Procesoarele superscalare sunt capabile să apeleze mai multe instrucțiuni într-un singur ciclu de ceas Numărul de instrucțiuni efectiv apelate depinde atât de designul procesorului, cât și de situația actuală Limitările hardware dictează numărul maxim de comenzi care pot fi apelate în același timp - de obicei de la două la șase În plus, dacă o instrucțiune necesită un bloc funcțional indisponibil sau rezultatul unei alte instrucțiuni care nu a fost încă primită, o astfel de instrucțiune nu va fi apelată chiar dacă este posibil fizic Un alt tip de paralelism la nivel de instrucțiune este implementat în procesoarele cu un cuvânt de instrucțiune foarte lung (Very Long Instruction Word, VLIW) În implementarea lor originală, sistemele VLIW prezentau într-adevăr cuvinte lungi cu instrucțiuni care accesau mai multe blocuri funcționale De exemplu, luați în considerare transportorul prezentat în Fig , a Include cinci blocuri funcționale și este capabil să execute simultan două operații întregi, o operație în virgulă mobilă, o instrucțiune de încărcare și o instrucțiune de salvare O instrucțiune a acestui sistem VLIW conține cinci opcode și cinci perechi de operanzi - un cod și o pereche pentru fiecare bloc funcțional Ținând cont de faptul că codul de operare are biți, registrul - biți, iar celula de memorie - de biți, lungimea totală a comenzii poate ajunge la de biți, ceea ce, vedeți, este mult Cu toate acestea, această decizie a fost considerată nereușită Cert este că nu toate comenzile au putut accesa blocurile funcționale corespunzătoare, ca urmare, operațiunile goale fără sens au apărut din abundență (Fig , b) În sistemele moderne VLIW, ar trebui furnizat un mecanism pentru marcarea pachetelor de comenzi, de exemplu, bitul "terminare a pachetului" poate fi utilizat pentru aceasta (Fig , c) Procesorul poate selecta și rula întregul pachet Sarcina de a pregăti pachete de comenzi care pot fi executate împreună este rezolvată de compilator Capitolul Arhitecturi de calculatoare paralele Operare gol -L- -L- I L- IIF-S I-FLS I-FL- FS -L- -Îlfs b Comanda VLIW IIFS Eu FLS IIFS Marcator de sfârșit de legare LFS Pachet V Orez Conducta procesorului (a); secvența de comenzi VLIW (b); flux de comandă cu pachete marcate (c) De fapt, în sistemele VLIW, soluția la problema compatibilității comenzilor este transferată din timpul de execuție în etapa de compilare Ca rezultat, hardware-ul este simplificat și mai ieftin În plus, deoarece nu există constrângeri de timp dificile în funcționarea compilatorului, lanțurile de comandă sunt formate mai semnificativ decât dacă s-ar întâmpla în timpul execuției Din păcate, este foarte greu de pus în practică o astfel de transformare radicală a arhitecturii procesorului, ceea ce este confirmat de răspândirea mai mult decât moderată a procesorului Itanium Este demn de remarcat faptul că paralelismul la nivel de instrucție nu este singura formă posibilă de paralelism de nivel scăzut Există și paralelism la nivel de memorie, care presupune executarea simultană a mai multor operații în memorie [ ] Paralelism în CPU Procesor TriMedia VLIW În capitolul , folosind procesorul Itanium ca exemplu, am întâlnit deja arhitectura VLIW Acum haideți să facem cunoștință cu un alt procesor VLIW - TriMedia produs de Philips TriMedia este un procesor încorporat pentru imagini, dispozitive audio și video precum playere CD, DVD și MP , recordere CD și DVD, televizoare interactive, camere digitale, camere video etc Având în vedere specializarea, nu este nimic surprinzător în numeroasele diferențe dintre TriMedia și Itanium - un procesor de uz general pentru servere de înaltă performanță O comandă TriMedia poate include până la cinci operațiuni În condiții complet optime, o instrucțiune este rulată pe ciclu de ceas și sunt selectate cinci operații Viteza nominală de ceas a procesorului este de sau MHz, dar din moment ce pot fi efectuate până la cinci operații într-un ciclu, viteza reală este de cinci ori mai mare În prezentarea ulterioară, vom trece de la caracteristicile implementării procesorului TM Alte versiuni de TriMedia au o serie de diferențe minore Comanda standard TriMedia este prezentată în fig Instrucțiunile variază în natură, de la instrucțiuni obișnuite cu numere întregi de , și de biți la instrucțiuni în virgulă mobilă IEEE și instrucțiuni de procesare media paralelă Execuția a cinci operații pe ciclu și disponibilitatea comenzilor pentru procesarea paralelă a datelor multimedia permit procesorului TriMedia să decodeze programatic streaming video digital provenit de la o cameră video, păstrând dimensiunea și rata de cadre originale Slot Slot Schimb Slot Slot Funcționare în slot Salvare la încărcare media Echipă Orez Comanda TriMedia standard cu cinci operații TriMedia folosește memoria organizată pe octeți și mapează registrele I/O cu spațiul de memorie Jumătate de cuvinte ( biți) și cuvinte întregi ( de biți) sunt aliniate pe granițele naturale Ordinea octetilor poate fi mare sau mare, în funcție de bitul cuvântului de stare a programului setat de sistemul de operare Acest bit definește mecanismul de transfer de date pentru operațiunile de încărcare și stocare între memorie și registre Procesorul oferă un cache asociat cu căi partajat cu aceeași lungime de linie ( de octeți) în memoria cache de instrucțiuni și date Capacitatea cache-ului de instrucțiuni este de KB; capacitate cache de date - KB Există de registre universale pe de biți Valorile registrelor R și R sunt egale cu zero și, respectiv, unu hardware Restul de de registre sunt echivalente din punct de vedere funcțional și pot fi utilizate în orice scop În plus, sunt furnizate patru registre specializate pe de biți: Capitolul Arhitecturi de calculatoare paralele un numărător de programe, un registru de cuvinte de stare a programului și două registre legate de întreruperi În cele din urmă, un registru de de biți numără numărul de cicluri de procesor de la ultima resetare La o frecvență de ceas de MHz, ciclul complet al contorului este de de ani Procesorul TM are blocuri funcționale concepute pentru a efectua operații aritmetice, logice și de control (există și un bloc de control cache, dar nu îl vom lua în considerare) Toate sunt enumerate în tabel Primele două coloane oferă numele blocului și o scurtă descriere a funcțiilor pe care acesta le îndeplinește A treia coloană indică numărul de copii hardware ale blocului A patra coloană conține valoarea așteptării (mai precis, numărul de cicluri) până la finalizarea operației În acest context, este util să rețineți că toate blocurile funcționale, cu excepția blocurilor rădăcină pătrată și diviziune în virgulă mobilă, sunt canalizate Deși așteptarea vă spune cât timp trebuie să așteptați înainte de a finaliza operația, nu trebuie să uitați că în fiecare nou ciclu puteți începe noi operațiuni Astfel, fiecare dintre cele trei comenzi consecutive poate conține două operații de încărcare, ceea ce înseamnă că șase operațiuni de încărcare pot fi simultan în diferite etape de execuție Tabelul Blocuri funcționale ale TM cu indicarea numărului lor, a întârzierii și a corespondenței cu sloturile de comandă Descriere bloc # Așteptați Operații cu constante Operații cu adresare directă Da Da Da Da Da Integer ALU -bit Aritmetică și logică Da Da Da Da Da Schimbări Schimbări pe mai mulți biți Da Da Da Da Da Încărcarea și salvarea accesărilor în memorie Da Da Înmulțirea întregului și în virgulă mobilă Înmulțirea întregului și în virgulă mobilă pe de biți Da Da ALU în virgulă mobilă Aritmetică în virgulă mobilă Da Da Comparaţie în virgulă mobilă Operaţii de comparare în virgulă mobilă Da Rădăcina pătrată și împărțirea numerelor în virgulă mobilă Împărțirea și rădăcina pătrată a numerelor în virgulă mobilă Da Paralelism în CPU Descriere bloc # Așteptați Controlul fluxului ramurilor Da Da Da DSP ALU Aritmetică multimedia (două cuvinte de biți sau patru de biți) Da Da Da Multiplicator pentru procesarea semnalului digital Multiplicarea datelor multimedia (două pe biți Da Da sau patru cuvinte pe biți) În cele din urmă, ultimele șase coloane definesc alocarea comenzilor către blocurile funcționale De exemplu, operațiunile de comparare cu virgulă mobilă pot fi efectuate numai în al treilea slot de comandă Blocul funcțional de operare constantă este utilizat atunci când se efectuează operații cu adresare directă, de exemplu, la încărcarea unui număr dintr-un câmp de operație într-un registru ALU întreg efectuează adunări, scăderi, operații logice standard și operații de împachetare și dezambalare Blocul de deplasare poate efectua deplasări de registru cu numărul specificat de biți în ambele direcții Blocul de încărcare și stocare citește cuvintele din memorie în registre și le scrie înapoi În general, TriMedia este un procesor RISC cu funcționalitate avansată, astfel încât operațiunile normale sunt efectuate cu registre, iar accesările la memorie sunt efectuate folosind un bloc funcțional de încărcare și stocare Puteți transfera , sau de biți La executarea comenzilor aritmetice și logice, memoria nu este accesată Blocul de multiplicare efectuează operații atât pe numere întregi, cât și pe numere în virgulă mobilă Următoarele trei blocuri sunt responsabile pentru adunarea și scăderea în virgulă mobilă, compararea, rădăcinile pătrate și împărțirea Operațiile de salt sunt efectuate de blocul funcțional de ramificație Tranziția este urmată de o întârziere fixă de cicluri, timp în care se execută întotdeauna comenzi (adică până la operații) Acest lucru se întâmplă chiar și cu salturi necondiționate În cele din urmă, ajungem la două blocuri concepute pentru a efectua operațiuni multimedia speciale De fapt, operațiunile multimedia sunt efectuate de un procesor de semnal digital (Digital Signal Processor, DSP) Trebuie remarcat imediat că, spre deosebire de operațiile cu numere întregi bazate pe aritmetica complementului a doi, operațiile multimedia folosesc aritmetica saturată Dacă rezultatul unei operații nu poate fi exprimat din cauza unui depășire, în loc să se arunce o excepție sau să se întoarcă ca rezultat gunoi, se înlocuiește cel mai apropiat număr valid Capitolul Arhitecturi de calculatoare paralele De exemplu, pentru numerele de biți fără semn, adăugarea a și ar duce la Deoarece unele operațiuni și sloturi de comandă sunt incompatibile, este obișnuit să existe mai puțin de cinci operații într-o comandă Dacă un anumit slot nu este utilizat, acesta trebuie comprimat pentru a minimiza consumul de spațiu Operațiile prezente în instrucțiune pot dura , sau de biți În funcție de numărul de operații conținute efectiv într-o comandă TriMedia, dimensiunea acesteia variază de la la de octeți (inclusiv supraîncărcarea de dimensiune fixă) Operațiile incluse într-o comandă TriMedia nu sunt verificate pentru compatibilitate în timpul execuției Prin urmare, operațiunile sunt efectuate chiar dacă sunt incompatibile, ceea ce generează un rezultat incorect Decizia de a abandona controalele a fost luată de dezvoltatori pentru a economisi timp și tranzistori În procesoarele Pentium se efectuează verificări de compatibilitate pentru operațiile superscalare, totuși, ca urmare, soluția devine mai complicată, costurile de timp cresc, iar numărul de tranzistori utilizați crește În TriMedia, sarcina de planificare este transferată compilatorului, care poate optimiza plasarea operațiunilor în cuvinte de instrucțiuni fără constrângeri inutile de timp Cu toate acestea, dacă o operație necesită un bloc funcțional indisponibil, întreaga comandă trebuie să aștepte până când devine din nou disponibilă La fel ca Itanium , operațiunile TriMedia sunt predictive Fiecare operație (cu două excepții minore) specifică un registru care trebuie verificat înainte de a efectua această operație Dacă bitul cel mai puțin semnificativ al acestui registru este setat, operația este efectuată; în caz contrar, se omite Fiecare dintre cele cinci (sau mai puține) tranzacții este prezisă individual Iată un exemplu de operație prezisă: IF R IADD R , R -> R Aici este testat registrul R , iar dacă valoarea bitului său cel mai puțin semnificativ este egală cu unu, conținutul registrelor R și R este adăugat și stocat în R Operația poate fi făcută necondiționată folosind R ca registru de predicat (valoarea sa este întotdeauna ) Registrul R (zero hardware) face operația goală Operațiunile multimedia din TriMedia sunt împărțite în grupuri enumerate în tabel Multe dintre aceste operații folosesc tăierea, o tehnică în care un operand este "condus" într-un anumit interval pe baza valorilor minime sau maxime ale operanzilor din afara acelui interval Tăierea este disponibilă pentru operanzi pe biți, biți și de biți De exemplu, ca urmare a valorilor de tăiere de la la în intervalul de la la , rămân valori de la la Operațiile de tăiere sunt efectuate în grupul de tăiere Următoarele cinci grupuri din tabel combina operații cu operanzi de diferite dimensiuni, prevăzând tăierea rezultatelor într-un anumit interval Operațiile de grup get min și max analizează două registre și găsesc valorile minime și maxime pentru fiecare octet În mod similar, într-un grup de comparație, două registre sunt tratate ca patru perechi de octeți, fiecare dintre acestea fiind comparat cu ceilalți Paralelism în CPU Tabelul Principalele grupuri de operațiuni specializate în TriMedia Descrierea Grupului Decuparea Decuparea octeți sau jumătăți de cuvinte Obține valoare absolută (DSP) Obține valoare absolută, obține semn, decupează Adăugare (DSP) Adăugare semnată de valori cu tăiere Scăderea (DSP) Scăderea valorilor cu semn și tăiere Înmulțire (DSP) Înmulțirea valorilor cu semn și tăiere Obține minimum și maxim Obține minimum sau maxim de patru perechi de octeți Comparație Octet-cu-octet Comparație a două registre Shift Schimbați o pereche de operanzi pe biți Suma produselor Suma semnată a produselor de sau biți Fuzionarea, împachetarea, schimbarea octetilor și manipularea jumătate de cuvânt Medie pătratică octet cu octet Medie pătratică octet cu octet fără semn Medie pe octeți Media pe octeți cu patru elemente, fără a ține cont de semn Byte Multiply Înmulțiți valori de biți fără semn Estimarea mișcării Însumarea nesemnată a valorilor absolute semnate de biți Diverse Alte operatii aritmetice Operațiunile multimedia sunt rareori efectuate pe numere întregi de de biți Acest lucru se datorează faptului că imaginile sunt de obicei construite în modelul de culoare RGB (roșu, verde, albastru) cu valori de pixeli roșu, verde și albastru de biți La procesarea (de exemplu, comprimarea) o imagine, aceasta este exprimată în trei componente, câte una pentru fiecare culoare (în spațiu RGB) sau într-o formă echivalentă logic (în spațiu YUV, despre care vom discuta în continuare) În orice caz, cea mai mare parte a calculelor este efectuată pentru matrici dreptunghiulare de numere întregi fără semn pe biți Pentru a procesa eficient astfel de matrici, TriMedia oferă numeroase operațiuni specializate Ca exemplu simplu, luați în considerare colțul din stânga sus al unei matrice de valori de biți stocate în memoria big endian (Figura a) Blocul x din acest colț conține valori de biți de la A la P Să presupunem că rezultatul transpunerii imaginii este matricea prezentată în Fig , b Cum se obține acest rezultat? Transpunerea se poate face în operații, fiecare încarcă octeții în registre noi, după care trebuie efectuate încă operații pentru a plasa acești octeți la locul lor (rețineți că cei patru diago Capitolul Arhitecturi de calculatoare paralele octeții interni nu sunt mutați în timpul transpunerii) Problema este că această schemă necesită de operații de memorie lungi și consumatoare de timp Orez Matricea elementelor de biți (a); matricea transpusă (b); matricea originală transferată în patru registre (c); transpune matricea in patru registre (r) Există o altă cale În primul rând, sunt efectuate patru operații, fiecare încarcând un cuvânt în patru registre diferite - de la R la R (așa cum se arată în Fig , c) Apoi, folosind operații de mascare și deplasare, cele patru cuvinte rezultate sunt combinate și se formează rezultatul dorit (Fig , d) La sfârșitul cuvântului sunt stocate în memorie În ciuda reducerii semnificative a numărului de accesări la memorie (de la la ), eficiența acestei metode nu este ridicată din cauza mascării și deplasării - este nevoie de prea multe operațiuni pentru a extrage și a pune toți octeții în locurile potrivite TriMedia are o metodă mai bună Mai întâi, patru cuvinte sunt plasate în registre În acest caz, rezultatul este format nu prin mascare și deplasări, ci prin operații specializate de extragere și plasare octeți în registre Astfel, opt operații multimedia speciale și același număr de accesări la memorie sunt suficiente pentru a transpune o imagine Codul începe cu două operații de încărcare în segmentele și pentru a plasa cuvinte în registrele R și R , urmate de operații similare pentru a încărca în registrele R și R Echipele care conțin aceste operațiuni pot folosi Segmentele , și în orice alt scop După încărcarea tuturor cuvintelor, operații multimedia speciale, împreună cu două operațiuni de salvare, pot fi împachetate în două comenzi care formează rezultatul În cele din urmă, sunt necesare doar instrucțiuni, din cele de sloturi rămânând disponibile pentru alte operațiuni, ceea ce înseamnă că numărul de sloturi corespunde cu aproximativ trei instrucțiuni pentru rezolvarea problemei Alte operațiuni multimedia sunt la fel de eficiente Datorită acestor operațiuni, precum și împărțirii comenzii în cinci sloturi, procesorul TriMedia se dovedește a fi un instrument extrem de eficient pentru procesarea datelor multimedia Multithreading în procesor Pentru toate procesoarele moderne cu pipeline, aceeași problemă este caracteristică - dacă un cuvânt nu este găsit în cache-urile de la primul și al doilea nivel atunci când se solicită memorie, este nevoie de mult timp pentru a încărca acest cuvânt în cache, Paralelism în CPU timp în care transportorul este inactiv O tehnică pentru rezolvarea acestei probleme se numește multithreading pe cip Acesta permite procesorului să gestioneze simultan mai multe fire de execuție de program și, prin urmare, să mascheze timpii de inactivitate Pe scurt, principiul multithreading-ului poate fi enunțat după cum urmează: dacă firul de program este blocat, procesorul se poate asigura că hardware-ul este încărcat complet prin pornirea firului de program Ideea de bază este simplă, este implementată în diferite moduri, pe care le vom lua în considerare Prima dintre acestea, numită multithreading cu granulație fină, în raport cu un procesor capabil să apeleze o instrucțiune pe ciclu de ceas, este ilustrată în Fig Pe fig , a-c arată trei fluxuri de program (L, B, C) corespunzătoare la cicluri de mașină În timpul primului ciclu, firul A execută comanda A Deoarece această instrucțiune se completează într-un ciclu, atunci când are loc al doilea ciclu, instrucțiunea L este pornită Accesul său la memoria cache de primul nivel nu reușește, așa că trec două cicluri înainte ca cuvântul dorit să fie preluat din memoria cache de nivel al doilea Execuția firului continuă în bucla După cum se arată în figură, firele B și C sunt, de asemenea, în mod regulat inactiv Ca parte a acestei soluții, următoarea comandă nu este apelată până când cea anterioară nu este finalizată Mai precis, în prezența unui contor de lovituri complex, în unele cazuri acest lucru este permis, dar pentru simplitate excludem o astfel de posibilitate A A AZ A A A A A A B C A B C AZ B C A B C B B B B B B B B С С СЗ С С С С С Ciclu A A B C C C C AZ A A Ciclu Orez Trei fluxuri de programe Pătratele goale înseamnă inactiv așteptarea datelor din memorie (a-e); multithreading cu granulație fină (d); multithreading grosier (d) Cu multithreading cu granulație fină, timpul de inactivitate este mascat prin executarea firelor "într-un cerc", adică diferite fire sunt lansate în cicluri adiacente (Fig , d) Până la sosirea ciclului de timp , accesul la memorie inițiat de instrucțiunea A s-a încheiat, deci chiar dacă instrucțiunea A are nevoie de rezultatul instrucțiunii A , pornește În acest caz, durata maximă de inactivitate este de două cicluri, ceea ce înseamnă că, dacă există trei fire de execuție de program, operațiunea de inactivitate încă se finalizează la timp Cu un timp inactiv de cicluri, ar fi necesare fire de program pentru funcționarea continuă etc Deoarece firele de execuție diferite ale programului nu sunt legate între ele în niciun fel, fiecare dintre ele are nevoie de propriul set de registre Trebuie specificat pentru fiecare instrucțiune apelată, iar apoi hardware-ul va ști ce set de registre să acceseze atunci când este necesar Prin urmare, numărul maxim de fire de execuție simultană a programului este determinat în timpul dezvoltării cipului Capitolul Arhitecturi de calculatoare paralele Cauzele timpului de nefuncționare nu se limitează la accesările la memorie Uneori, executarea instrucțiunii următoare necesită rezultatul instrucțiunii anterioare, care nu a fost încă evaluată În alte cazuri, comanda nu poate fi apelată deoarece urmează o ramură condiționată a cărei direcție nu este încă cunoscută Regula generală este formulată după cum urmează: dacă există k pași în conductă, dar cel puțin k fire de execuție de program pot fi lansate într-un cerc, atunci mai mult de o comandă nu pot fi executate într-un fir la un moment dat, deci conflicte între ele sunt excluse Într-o astfel de situație, procesorul poate rula la viteză maximă fără repaus Desigur, numărul de fire disponibile nu este întotdeauna egal cu numărul de etape de conductă, așa că unii dezvoltatori preferă o tehnică numită multithreading cu granulație grosieră, care este ilustrată în Fig e În acest caz, firul de execuție al programului A continuă să se execute secvenţial, până la timpul de inactivitate În acest caz, se pierde un ciclu Apoi există o comutare la prima comandă a fluxului de program B (Bi) Deoarece această comandă trece imediat în starea inactivă, în ciclul , comanda C este deja executată Deoarece de fiecare dată când o instrucțiune este inactivă, se pierde un ciclu, multithreading cu granulație grosieră pare să fie inferioară multithreading cu granulație fină în ceea ce privește eficiența, dar are un avantaj semnificativ - datorită unui număr mai mic de fire de execuție a programului, consumul de resursele procesorului sunt reduse semnificativ Cu un număr insuficient de fire active, această tehnică este optimă Pe baza descrierii noastre, multithreadingul grosier comută pur și simplu între fire, dar acesta nu este singurul curs de acțiune prevăzut de această tehnică Este posibil să comutați imediat de la comenzile care au potențialul de a cauza timpi de nefuncționare (cum ar fi încărcarea, salvarea și tranzițiile) fără a fi nevoie să aflați dacă timpul de nefuncționare este de fapt planificat Această strategie vă permite să comutați mai devreme decât de obicei (imediat după decodificarea instrucțiunii) și elimină buclele nesfârșite Cu alte cuvinte, execuția continuă până când este detectată posibilitatea unei probleme, după care urmează trecerea O astfel de comutare frecventă face ca multithreading cu granulație grosieră să fie legat de multithreading cu granulație fină Indiferent de opțiunea multithreading utilizată, este necesar să urmăriți cumva apartenența fiecărei operații la un anumit thread de program În cadrul multithreadingului cu granulație fină, fiecărei operații i se atribuie un identificator de fir, astfel încât atunci când se deplasează de-a lungul conductei, apartenența acesteia nu este îndoielnică Multithreadingul grosier oferă posibilitatea de a curăța conducta înainte de a începe fiecare fir succesiv În acest caz, identitatea firului de execuție curent este clar definită Desigur, această tehnică este eficientă numai dacă pauzele dintre comutare sunt mult mai lungi decât timpul necesar pentru eliberarea conductei Toate cele de mai sus se aplică procesoarelor care nu pot apela mai mult de o instrucțiune pe ciclu de ceas Cu toate acestea, știm că această limitare nu este relevantă pentru procesoarele moderne În ceea ce privește imaginea din fig , presupunem că procesorul poate apela instrucțiuni pe ciclu, însă afirmația despre imposibilitatea pornirii instrucțiunilor ulterioare dacă cea anterioară este inactivă Paralelism în CPU spiritul rămâne în vigoare Figura a ilustrează multithreading cu granulație fină într-un procesor superscalar dublu După cum puteți vedea, firul A rulează primele două comenzi în timpul primului ciclu, dar firul B rulează doar o comandă în al doilea ciclu A B C AZ B C A B C A B C A B C C AZ A B C A A B B A C A C B C A B C A C C A C A B B Bucla - a Bucla b A B C C A B C A B B B C A C NW AZ A C A A B B B C Ciclul de intrare Orez Multithreading într-un procesor dual: multithreading cu granulație fină (a); multithreading cu module mari (b); multithreading sincron (a) Pe fig Figura b prezintă implementarea multithreading-ului cu granulație grosieră într-un procesor dual cu un planificator static care elimină bucle infinite atunci când instrucțiunile inactiv Aici, firele de execuție ale programului se execută pe rând, procesorul apelează două instrucțiuni în fiecare fir până detectează timpul de inactivitate; în ciclul următor după timpul de inactivitate, începe execuția firului următor În procesoarele superscalare, există o altă modalitate de a organiza multithreading - așa-numitul multithreading sincron (multithreading simultan), care este ilustrat în Fig , c Aceasta tehnica este o imbunatatire a multithreading-ului cu granulatie grosiera, in care fiecare thread de program poate rula doua instructiuni per clock, dar atunci cand este inactiv, instructiunile urmatorului thread sunt rulate pentru a asigura utilizarea completa a procesorului Cu multithreading sincron, toate blocurile funcționale sunt încărcate complet Dacă comanda nu poate fi pornită deoarece blocul funcțional este ocupat, este selectată comanda dintr-un alt fir Figura presupune că instrucțiunea B este inactivă în bucla AND, astfel încât instrucțiunea C este pornită în bucla Informații suplimentare despre multithreading pot fi găsite în [ , , ] Multithreadingul și execuția speculativă sunt discutate în [ ] Multithreading în Pentium După ce ne-am ocupat de teoria multithreading-ului, să luăm în considerare un exemplu practic - Pentium Deja în stadiul de dezvoltare a acestui procesor, inginerii Intel au continuat să lucreze la creșterea performanței acestuia fără a aduce modificări interfeței programului Au fost luate în considerare cinci metode simple: Creșterea frecvenței ceasului Plasarea a două procesoare pe un cip Introducerea de noi blocuri funcționale Capitolul Arhitecturi de calculatoare paralele Prelungirea transportorului Folosind multithreading Cea mai evidentă modalitate de a îmbunătăți performanța este de a crește viteza ceasului fără a modifica alți parametri De regulă, fiecare model de procesor ulterior are o viteză de ceas puțin mai mare decât precedentul Din păcate, cu o creștere în linie dreaptă a vitezei de ceas, dezvoltatorii se confruntă cu două probleme: un consum crescut de energie (care este relevant pentru laptopuri și alte dispozitive de calcul care funcționează cu baterii) și supraîncălzire (care necesită radiatoare mai eficiente) A doua metodă - plasarea a două procesoare pe un cip - este relativ simplă, dar presupune dublarea suprafeței ocupate de cip Dacă fiecare procesor este prevăzut cu propria sa memorie cache, numărul de cipuri per wafer se reduce la jumătate, dar asta înseamnă și costul de producție de două ori Dacă ambele procesoare partajează memoria cache, o creștere semnificativă a amprentei poate fi evitată, dar în acest caz apare o altă problemă - cantitatea de memorie cache per procesor este redusă la jumătate, iar acest lucru afectează inevitabil performanța În plus, în timp ce aplicațiile de server profesionale sunt capabile să utilizeze pe deplin resursele mai multor procesoare, în programele desktop obișnuite, paralelismul intern este dezvoltat într-o măsură mult mai mică Introducerea de noi blocuri funcționale nu este, de asemenea, dificilă, dar este important să găsim un echilibru aici Ce rost are o duzină de ALU dacă cipul nu poate emite comenzi către conductă la o rată care să poată încărca toate acele blocuri? O conductă cu un număr crescut de etape, capabilă să împartă sarcinile în segmente mai mici și să le proceseze în perioade scurte de timp, pe de o parte, îmbunătățește performanța, pe de altă parte, crește consecințele negative ale previziunii greșite a tranzițiilor, ratelor de cache, întreruperi și alte evenimente care perturbă procesarea normală a instrucțiunilor de curs în procesor În plus, pentru a realiza pe deplin capacitățile conductei extinse, este necesară creșterea frecvenței de ceas, iar acest lucru, după cum știm, duce la un consum crescut de energie și la disiparea căldurii În cele din urmă, puteți implementa multithreading Avantajul acestei tehnologii este că introduce un fir software suplimentar care permite folosirea resurselor hardware care altfel ar fi inactive Pe baza rezultatelor studiilor experimentale, dezvoltatorii Intel au descoperit că o creștere cu % a suprafeței cipului atunci când se implementează multithreading pentru multe aplicații oferă o creștere a performanței de % Primul procesor Intel care a suportat multithreading a fost Cheop din Ulterior, începând cu , GHz, multithreading-ul a fost introdus în linia Pentium Intel numește implementarea multithreading-ului în hyperthreading-ul Pentium Principiul principal al hyperthreading-ului este executarea simultană a două fire de execuție de program (sau procese - procesorul nu distinge procesele de pro Paralelism în CPU curge grame) Sistemul de operare tratează procesorul Pentium hyper-threaded ca pe un complex cu două procesoare cu cache partajate și memorie principală Sistemul de operare efectuează planificarea pentru fiecare fir de program separat Astfel, două aplicații pot rula în același timp De exemplu, un e-mail ar putea trimite sau primi mesaje în fundal în timp ce utilizatorul interacționează cu o aplicație interactivă - adică demonul și programul utilizator rulează în același timp, ca și cum două procesoare ar fi disponibile pentru sistem Programele de aplicație capabile să se execute în mai multe fire pot folosi atât "procesoare virtuale" De exemplu, programele de editare video permit utilizatorilor să aplice filtre pentru toate cadrele Astfel de filtre corectează luminozitatea, contrastul, echilibrul de culoare și alte proprietăți ale cadrelor Într-o astfel de situație, programul poate atribui unui procesor virtual să proceseze cadrele pare, iar altul să proceseze cadrele impare În acest caz, cele două procesoare vor funcționa complet independent unul de celălalt Deoarece firele de execuție software accesează aceleași resurse hardware, este necesară coordonarea acestor fire În contextul hyperthreading-ului, dezvoltatorii Intel au identificat patru strategii utile de gestionare a partajării resurselor: duplicarea resurselor și partajarea hard, threshold și completă a resurselor Să aruncăm o privire asupra acestor strategii Să începem cu duplicarea resurselor După cum știți, unele resurse sunt duplicate pentru a organiza fluxurile de programe De exemplu, deoarece fiecare fir de program are nevoie de control individual, este necesar un al doilea contor de program În plus, este necesară introducerea unui al doilea tabel pentru maparea registrelor arhitecturale (EAX, EBX etc ) la registrele fizice; în mod similar, controlerul de întrerupere este duplicat, deoarece gestionarea întreruperilor pentru fiecare fir se face individual Aceasta este urmată de o tehnică de partiţionare solidă a resurselor (partajarea resurselor partiţionate) între firele de execuţie a programului De exemplu, dacă procesorul are o coadă între două etape funcționale ale conductei, atunci jumătate din sloturi pot fi date firului , cealaltă jumătate firului Partajarea resurselor este ușor de implementat, nu duce la dezechilibru și asigură independența completă a firelor de execuție a programului unul față de celălalt Odată cu separarea completă a tuturor resurselor, un procesor se transformă de fapt în două Pe de altă parte, poate apărea o situație în care un fir de execuție de program nu utilizează resurse care ar putea fi utile celui de-al doilea fir, dar pentru care nu are drepturi de acces Ca urmare, resursele care ar putea fi utilizate altfel sunt inactive Opusul partajării dure este partajarea completă a resurselor În această schemă, resursele dorite pot fi accesate de orice fir de program și sunt deservite în ordinea în care sunt primite cererile de acces Să considerăm o situație în care un flux rapid, constând în principal din operații de adunare și scădere, coexistă cu un flux lent, care implementează operații de înmulțire și împărțire Dacă sunt apelate comenzi Capitolul Arhitecturi de calculatoare paralele din memorie mai repede decât se efectuează operațiunile de înmulțire și împărțire, numărul de instrucțiuni apelate în firul lent și puse în coadă pe conductă va crește treptat În cele din urmă, aceste comenzi vor umple coada, ca urmare, fluxul rapid se va opri din cauza lipsei de spațiu în el Partajarea completă a resurselor rezolvă problema utilizării suboptime a resurselor partajate, dar creează un dezechilibru în consumul acestora - un fir poate încetini sau opri altul Schema intermediară este implementată în cadrul partajării resurselor de prag Conform acestei scheme, orice fir de program poate primi dinamic o anumită cantitate (limitată) de resurse Când este aplicată resurselor replicate, această abordare oferă flexibilitate fără amenințarea ca unul dintre firele de execuție a programului să fie inactiv din cauza incapacității de a obține resurse Dacă, de exemplu, fiecăreia dintre fire i se interzice să ocupe mai mult de / din coada de comenzi, consumul crescut de resurse de către firul lent nu va interfera cu execuția celui rapid Modelul de hyperthreading al Pentium integrează diferite strategii de partajare a resurselor Astfel, se încearcă rezolvarea tuturor problemelor asociate fiecărei strategii Duplicarea este implementată în ceea ce privește resursele la care ambele fire de execuție au nevoie constant de acces (în special, în ceea ce privește contorul de programe, tabelul de mapare a registrului și controlerul de întreruperi) Dublarea acestor resurse crește aria microcircuitului cu doar % - veți fi de acord că este un preț destul de rezonabil pentru multithreading Resursele care sunt disponibile într-un astfel de volum încât este practic imposibil ca acestea să fie capturate de un singur fir (de exemplu, linii cache) sunt alocate dinamic Accesul la resursele care controlează funcționarea conductei (în special, numeroasele sale cozi) este împărțit - fiecărui fir de program i se acordă jumătate din sloturi Conducta principală a arhitecturii Netburst implementată în Pentium este prezentată în Fig , ; zonele albe și gri din această ilustrație reprezintă mecanismul de alocare a resurselor între firele de execuție albe și gri ale programului Orez Partajarea resurselor între firele de execuție a programului în microarhitectura NetBurst implementată în Pentium Paralelism în CPU După cum puteți vedea, toate cozile din această ilustrație sunt împărțite - fiecărui fir de program îi este alocată jumătate din sloturi Niciun fir nu poate restricționa munca celuilalt Blocul de distribuție și substituție este de asemenea împărțit Resursele de planificare sunt partajate dinamic, dar pe baza unor valori de prag - astfel, niciun fir nu poate ocupa toate sloturile cozii Pentru toate celelalte etape ale transportorului, există o separare completă Cu toate acestea, multithreadingul nu este atât de simplu Chiar și această tehnică avansată are dezavantajele ei Partiționarea hard a resurselor nu este asociată cu costuri serioase, dar partiționarea dinamică, în special în ceea ce privește pragurile, necesită monitorizarea consumului de resurse în timpul execuției În plus, în unele cazuri programele funcționează mult mai bine fără multithreading decât cu acesta Să presupunem, de exemplu, că dacă există două fire de execuție de program, fiecare dintre ele are nevoie de / din memoria cache pentru a funcționa corect Dacă ar fi executate pe rând, fiecare ar funcționa rezonabil de bine cu un număr mic de erori de cache (care sunt cunoscute a fi asociate cu supraîncărcare suplimentară) În cazul execuției paralele, ar exista semnificativ mai multe rateuri de cache pentru fiecare, iar rezultatul final ar fi mai rău decât fără multithreading Informații suplimentare despre mecanismul multithreading Pentium pot fi găsite în [ , , ] Multiprocesoare cu un singur cip În timp ce multithreading poate oferi îmbunătățiri semnificative de performanță la un cost rezonabil, unele aplicații au nevoie de performanță semnificativ mai mare și multithreading nu este suficient Pentru astfel de aplicații, există scheme multiprocesor Cipurile care acceptă două sau mai multe procesoare sunt utilizate în principal în serverele profesionale și în electronicele de larg consum Despre toate acestea vom vorbi acum Multiprocesoare omogene cu un singur cip Datorită dezvoltării tehnologiei VLSI (Very Large Scale Integrated Circuit), două sau mai multe procesoare puternice pot fi acum instalate pe un singur cip Deoarece aceste procesoare accesează întotdeauna aceleași module de memorie (cache-urile L și L și memoria principală), ele sunt considerate a fi un singur multiprocesor, așa cum am văzut în Capitolul Acestea sunt de obicei instalate în fermele mari de servere web Prin colocarea a două procesoare, separarea resurselor de memorie, a discului și a interfețelor de rețea, performanța serverului poate fi în multe cazuri dublată, iar costul de a face acest lucru va crește într-o măsură mult mai mică (deoarece chiar dacă un multiprocesor costă de două ori mai mult decât un procesor obișnuit, nu uitați că prețul său este doar o mică parte din costul total al sistemului) Capitolul Arhitecturi de calculatoare paralele Există două modele tipice pentru multiprocesoarele mici cu un singur cip În primul dintre ele (Fig , a) există un microcircuit și două conducte - astfel, viteza de execuție a instrucțiunilor se dublează teoretic În a doua soluție (Fig , b), microcircuitul oferă două nuclee independente, fiecare dintre ele conține un procesor cu drepturi depline Un nucleu este un cip mare (cum ar fi un procesor, un controler I/O sau cache) care se află pe un cip ca modul, de obicei împreună cu alte câteva nuclee Orez Multiprocesoare cu un singur cip: un cip cu două conducte (a); cip cu două nuclee (b) Prima soluție permite partajarea resurselor (cum ar fi blocuri funcționale) între procesoare; cu alte cuvinte, fiecare procesor poate accesa resurse care nu sunt solicitate de celălalt procesor A doua soluție necesită o modificare a designului microcircuitului și nu prevede mai mult de două procesoare Trebuie remarcat aici că nu este atât de dificil să plasați două sau mai multe nuclee de procesor pe un cip În continuare, pe măsură ce prezentarea avansează, vom reveni la subiectul multiprocesoarelor În acest capitol, acoperim în principal subiecte legate de multiprocesoare bazate pe cipuri cu un singur procesor, dar multe dintre ele se aplică cipurilor cu mai multe procesoare Multiprocesoare eterogene cu un singur cip Pe lângă servere, multiprocesoarele cu un singur cip sunt utilizate în sistemele încorporate, mai ales în electronice audiovizuale de larg consum, cum ar fi televizoare, playere DVD, camere video, console de jocuri, telefoane mobile etc Astfel de sisteme se caracterizează prin cerințe de performanță crescute și limitări severe În ciuda diferențelor de aspect, aceste dispozitive sunt în esență computere miniaturale cu unul sau mai multe procesoare, module de memorie, controlere și dispozitive I/O specializate De exemplu, un telefon mobil este un computer echipat cu un procesor, memorie, o tastatură compactă, un microfon, un sistem de semnal audio și un adaptor de rețea fără fir Paralelism în CPU Să luăm ca exemplu un DVD player portabil Calculatorul plasat în el este proiectat să îndeplinească mai multe funcții: Controlul unui servo ieftin și nesigur care reglează poziția capului Transformarea unui semnal analogic în formă digitală Corectarea erorilor Decriptare și gestionarea drepturilor Decomprimarea datelor video MPEG- Decomprimarea datelor audio Codificare de ieșire pentru redare pe sisteme de televiziune NTSC, PAL sau SECAM Toate aceste funcții trebuie efectuate în timp real, îndeplinind în același timp cerințe stricte de calitate a serviciului, consum de energie, disipare a căldurii, dimensiune, greutate și cost Datele de pe suportul DVD sunt stocate într-o spirală lungă (vezi, de exemplu, Figura ) Capul de redare trebuie să urmeze spirala discului care se rotește Prețul unor astfel de dispozitive rămâne scăzut datorită designului mecanic relativ simplu și controlului software strict al poziției capului Un semnal analogic vine de la cap, care trebuie convertit în format digital înainte de procesare După digitizare, se efectuează corectarea intensivă a erorilor care apar în timpul apăsării discului Datele video sunt stocate pe medii în format MPEG- , ceea ce necesită calcule complexe, cum ar fi transformările Fourier pentru a decomprima Datele audio sunt comprimate după modelul psihoacustic, care nu este mai puțin complex în ceea ce privește decompresia În cele din urmă, datele audio și video trebuie convertite într-un format adecvat pentru ieșire pe televizoare NTSC, PAL sau SECAM, în funcție de țara în care este utilizat DVD player-ul Desigur, este imposibil să rezolvi programatic toate aceste sarcini în timp real pe un procesor universal ieftin Astfel, este nevoie de un multiprocesor eterogen cu mai multe nuclee specializate Schema logică a DVD player-ului este prezentată în fig Nucleele prezentate în fig , diferă în specializarea funcțională; fiecare dintre ele este proiectat cu așteptarea de a obține rezultate maxime la cel mai mic cost posibil De exemplu, un semnal video comprimat pentru DVD este stocat în format MPEG- (aceasta este abrevierea organizației care a dezvoltat acest format, Motion Picture Experts Group - un grup de experți în domeniul imaginilor în mișcare) În timpul compresiei, fiecare cadru este împărțit în mai multe blocuri și pe fiecare dintre ele se efectuează transformări complexe Cadrul poate consta în întregime din blocuri modificate sau din blocuri prezente în cadrul precedent cu o indicație a decalajului (Ax, Ar/) față de poziția curentă și pixelii măsurați Din punct de vedere programatic, astfel de calcule sunt efectuate foarte lent, cu toate acestea, cu prezența unui procesor de decodare MPEG- , acest proces este accelerat semnificativ În mod similar, decodificarea și recodificarea unui semnal audio-video compozit conform Capitolul Arhitecturi de calculatoare paralele in raport cu unul dintre standardele standard de televiziune, este mai eficient sa folosesti un procesor hardware specializat În acest context, este firesc ca playerele DVD și dispozitivele similare să folosească multiprocesoare eterogene cu mai multe nuclee În același timp, deoarece procesorul de control este un dispozitiv programabil universal, un astfel de cip multiprocesor poate fi instalat într-un dispozitiv care este aproape funcțional, cum ar fi un DVD recorder Controler de disc procesor de control Cache Memorie Multiprocesor eterogen cu șase nuclee Codificator video compozit NTSC/PAL/SECAM Decodor audio Decodor de date video MPEG Orez Diagrama logică a unui simplu DVD player cu un multiprocesor eterogen și mai multe nuclee specializate pentru a îndeplini diverse funcții Multiprocesoarele eterogene se găsesc și în telefoanele mobile (CDMA sau GSM) echipate cu camere, camere video, aplicații de jocuri, browsere, clienți de e-mail, receptoare digitale prin satelit și conectivitate la internet wireless (IEEE sau WiFi) Nu toate telefoanele sunt echipate cu aceste funcții în acest moment, dar în viitor probabil că se vor răspândi peste tot Pe măsură ce dispozitivele moderne devin din ce în ce mai complexe, ceasurile devin navigatoare GPS și ochelarii de soare devin radiouri, nevoia de multiprocesoare eterogene este doar în creștere Destul de curând, cipurile cu de milioane de tranzistori vor deveni obișnuite Este foarte dificil să proiectați astfel de dispozitive voluminoase într-o versiune dintr-o singură piesă - până la finalizarea lucrării, acestea au toate șansele să devină învechite Este mult mai logic să plasați mai multe nuclee (care sunt, de fapt, biblioteci) cu un număr relativ mare de tranzistori pe un singur cip și să le combinați În același timp, dezvoltatorii trebuie să decidă care procesor va fi procesorul de control și care vor fi specializati Creșterea sarcinii componentei software a procesorului de control încetinește sistemul, dar reduce costul și dimensiunea cipului Prezența mai multor procesoare specializate pentru procesarea datelor audio și video necesită o creștere a zonei microcircuitului și crește costul acestuia, dar, pe de altă parte, oferă performanțe ridicate cu Paralelism în CPU frecvență de ceas relativ scăzută, în legătură cu care se reduc consumul de energie și disiparea căldurii Cu alte cuvinte, atunci când proiectează multiprocesoare multi-core, dezvoltatorii nu se gândesc la unde să plaseze tranzistori suplimentari, ci la cum și în ce domenii pot face compromisuri Programele de procesare a datelor audio și video funcționează cu cantități uriașe de informații Deoarece toate aceste date trebuie procesate rapid, de la la % din suprafața cipului este alocată pentru plasarea unuia sau altui tip de memorie În acest sens, se ridică numeroase întrebări De câte niveluri de memorie cache aveți nevoie într-un caz sau altul? Care ar trebui să fie modulele cache, separate sau combinate? Care ar trebui să fie volumul fiecărui modul? Cât de repede ar trebui să ruleze? Trebuie să plasez alte tipuri de module de memorie pe cip? Care: SRAM sau poate SDRAM? Răspunsurile la aceste întrebări determină în mare măsură performanța, consumul de energie și parametrii de disipare a căldurii ai microcircuitului Pe lângă procesoare și memorie, este necesar să se dezvolte o schemă pentru interacțiunea nucleelor între ele În sistemele mici, o singură magistrală este bine în acest scop, dar în sistemele mai mari, această soluție poate duce la faptul că schema de interacțiune a nucleelor va fi blocajul întregului sistem În multe cazuri, problema este rezolvată prin instalarea mai multor magistrale sau organizarea unei topologii inelare În acest din urmă caz, arbitrajul se realizează prin trimiterea unui mic pachet în jurul inelului - așa-numitul marker sau token Înainte de a transmite date, nucleul trebuie să dețină jetonul primit După finalizarea transferului, nucleul începe jetonul mai departe într-un cerc Astfel, conflictele în timpul transferului de date sunt excluse Ca exemplu de mecanism pentru interacțiunea nucleelor pe un cip, luați în considerare arhitectura CoreConnect de la IBM (Fig ) Este conceput pentru a combina nuclee în multiprocesoare eterogene cu un singur cip Pentru multiprocesoarele cu un singur cip, CoreConnect îndeplinește aproximativ același rol ca magistrala PCI pentru Pentium Pe de altă parte, spre deosebire de PCI, arhitectura CoreConnect nu a fost proiectată pentru compatibilitate cu hardware-ul și protocoalele vechi și fără a ține cont de limitările de comunicare la nivel de placă, cum ar fi numărul de pini pe conectorii de margine Arhitectura CoreConnect constă din trei autobuze Magistrala procesorului este o magistrală sincronă de mare viteză cu , sau de linii de date care rulează la , sau MHz Debitul său maxim este de , Gb/s (comparativ cu , Gb/s pentru magistrala PCI) Pipelinging permite nucleelor să solicite magistrala în timpul unui transfer de date În plus, ca și în magistrala PCI, nucleele pot transmite simultan date pe linii diferite Magistrala procesorului este optimizată pentru transmiterea de blocuri scurte de date și este concepută pentru a oferi interacțiune între nuclee rapide - procesoare, decodoare MPEG- , rețele de mare viteză și altele asemenea Capitolul Arhitecturi de calculatoare paralele Orez Arhitectura CoreConnect a IBM Deoarece o singură magistrală de procesor nu este suficientă pentru întregul cip, este prevăzută o a doua magistrală periferică pentru transferul de date între dispozitivele I/O cu viteză redusă (UART-uri, temporizatoare, controlere USB, dispozitive seriale I/O etc ) Simplifică comunicarea între perifericele pe , și de biți cu doar câteva sute de porți Magistrala periferică este, de asemenea, sincronă, iar debitul său maxim ajunge la Mbps Aceste două autobuze sunt conectate printr-un pod, amintind de podurile care legau până de curând magistralele PCI și ISA, până când magistrala ISA a fost eliminată complet în urmă cu ceva timp Arhitectura CoreConnect are, de asemenea, o magistrală de înregistrare a dispozitivului Aceasta este o magistrală de handshake asincronă extrem de lentă care permite procesoarelor să acceseze registrele dispozitivelor periferice pentru a controla aceste dispozitive Transmisiile pe acesta sunt efectuate neregulat, pe mai mulți octeți Combinația dintre un bus-on-a-chip standard, o interfață și infrastructura potrivită face din CoreConnect o versiune miniaturizată a arhitecturii PCI, pentru care procesoare și controlere compatibile pot fi produse în viitor Singura diferență este că, în lumea PCI, producătorii proiectează și vând plăci comercianților și utilizatorilor finali În cazul CoreConnect, dezvoltatorii de bază își licențează producția către producătorii de electronice de larg consum și alte companii, care apoi dezvoltă multiprocesoare eterogene pe baza propriilor nuclee și licențiate Întrucât producția de cipuri mari și complexe necesită investiții mari în capacitatea de producție, în majoritatea cazurilor producătorii de electronice de larg consum pregătesc modele pe ordinea cipurilor în companii specializate În prezent, există nuclee pentru diferite tipuri de procesoare (ARM, MIPS, PowerPC etc ), decodoare MPEG, procesoare de semnal digital și toate controlerele standard I/O Pe lângă CoreConnect, există și alte arhitecturi de magistrală pe cip În special [ ], anvelopa AMBA nu este în niciun fel inferioară acesteia în ceea ce privește popularitatea coprocesoare (Advanced Microcontroller Bus Architecture - arhitectură avansată de magistrală pentru microcontrolere) Ceva mai puțin populare [ , ] sunt magistralele VCI (Virtual Component Interconnect) și OCP-IP (Open Core Protocol-International Partnership) Cu toate acestea, autobuzele pe cip sunt doar începutul; rețele întregi sunt deja proiectate pe un singur cip [ ] Deoarece producătorii de cipuri nu pot crește constant viteza de ceas din cauza problemelor termice, dezvoltarea multiprocesoarelor cu un singur cip devine extrem de urgentă Informații suplimentare despre acest subiect pot fi obținute în [ , , , , , ] coprocesoare După ce ne-am ocupat de metodele de implementare a paralelismului intra-procesor, vom lua în considerare opțiunile de creștere a vitezei unui computer prin introducerea unui al doilea procesor specializat Astfel de coprocesoare sunt foarte diverse, inclusiv ca scară Mainframe-urile IBM și toate modelele ulterioare ale acestei linii oferă canale independente pentru I/O CDC includea procesoare independente responsabile de I/O Un alt domeniu de aplicare pentru coprocesoare este procesarea grafică și aritmetica în virgulă mobilă Chiar și un cip DMA poate fi considerat un coprocesor Uneori procesorul trimite o instrucțiune sau un set de instrucțiuni coprocesorului pentru execuție; în caz contrar, coprocesorul acționează independent și își execută propriile instrucțiuni Din punct de vedere structural, coprocesoarele pot fi realizate într-un pachet separat (de exemplu, canale I/O ale IBM ), ca o placă plug-in (ca în procesoarele de rețea) sau instalate pe microcircuitul principal (cum ar fi coprocesoarele pentru procesarea în virgulă mobilă) numere) Oricum ar fi, toate aceste opțiuni sunt unite de rolul subordonat al coprocesorului în raport cu procesorul principal În cele ce urmează, ne vom uita la câteva domenii în care utilizarea coprocesoarelor are ca rezultat îmbunătățiri măsurabile ale performanței, inclusiv suport pentru rețea, procesarea media și criptografia Procesoare de rețea Majoritatea computerelor moderne sunt conectate la o rețea locală sau la Internet Ca urmare a progresului tehnologic în domeniul echipamentelor de rețea, transmisia de date în rețele de astăzi este atât de rapidă încât devine din ce în ce mai dificilă procesarea programatică a tuturor datelor de intrare și de ieșire În acest sens, sunt dezvoltate procesoare de rețea speciale pentru procesarea traficului, iar multe sisteme de calcul profesionale sunt deja echipate cu ele astăzi În această subsecțiune, trecem în revistă pe scurt elementele de bază ale rețelei și discutăm cum funcționează procesoarele de rețea Capitolul Arhitecturi de calculatoare paralele Bazele rețelei Rețelele de calculatoare sunt împărțite în două tipuri principale: rețelele locale (Local Area Networks, LAN) conectează computere situate în aceeași cameră sau clădire, iar rețelele globale (Wide Area Networks, WAN) conectează computere situate la o distanță considerabilă unele de altele Cel mai popular tip de LAN se numește Ethernet Inițial, o simplă rețea Ethernet era formată dintr-un cablu gros, la care, folosind un dispozitiv sub denumirea ironică de dinte de vampir (robinet de vampir), erau furnizate fire de la calculatoarele incluse în rețea În rețelele Ethernet moderne, computerele sunt conectate la un comutator central (prezentat în dreapta în Figura ) În primele versiuni de Ethernet, rata de transfer de date era limitată la Mbps, iar în prima versiune comercială a crescut la Mbps Ulterior, au apărut versiuni Fast Ethernet și Gigabit Ethernet cu rate de transmisie de Mbps, respectiv Gbps Nu cu mult timp în urmă, a fost lansată o versiune comercială cu o viteză de Gb/s, iar în viitorul apropiat viteza va crește la Gb/s Orez Schema de conectare a utilizatorilor la servere de Internet Sediul furnizorului de aplicații Organizarea rețelelor globale nu este atât de uniformă În astfel de rețele sunt instalate calculatoare numite routere, între care sunt așezate canale cu fir sau cu fibră optică De la computerul sursă la computerul țintă, datele sunt transmise sub formă de blocuri mici de - de octeți, numite pachete La fiecare site de releu, sau hop, pachetul este mai întâi stocat în memoria routerului și apoi trimis mai departe de îndată ce linia de comunicație necesară este liberă Această abordare se numește comutare de pachete stocare și redirecționare Deși mulți oameni cred că Internetul este o rețea globală, din punct de vedere tehnic este o amalgamare a unui număr mare de rețele diferite Cu toate acestea, această distincție nu este fundamentală pentru o analiză ulterioară Pe fig coprocesoare Structura Internetului este prezentată din punctul de vedere al utilizatorului casnic Computerul unui astfel de utilizator accesează de obicei serverele web printr-o linie telefonică, conectându-se la aceasta fie folosind un modem obișnuit, fie printr-o linie ADSL (vezi Capitolul ) Pentru conectare poate fi folosit și un cablu TV prin cablu În acest caz, partea dreaptă a Fig va arăta puțin diferit, deoarece compania de cablu TV va fi furnizorul aplicațiilor Deci, computerul utilizatorului descompune datele în pachete pentru a le transmite unei companii speciale numite Internet Service Provider (ISP) ISP-ul însuși folosește o conexiune de mare viteză (de obicei, fibră optică) la una dintre rețelele regionale sau backbone care alcătuiesc Internetul Pachetele sunt transferate între computerele din rețea, deplasându-se hop cu hop la server Majoritatea companiilor de servicii web au ceea ce se numește firewall, un computer specializat care filtrează pachetele primite pentru a elimina pachetele nedorite (cum ar fi pachetele de la hackeri) Firewall-ul este conectat la LAN local (de obicei printr-un comutator), care este responsabil pentru livrarea pachetelor către serverul dorit Desigur, realitatea este mult mai complicată, dar ideile principale ilustrate în Fig sunt corecte Software-ul de rețea constă din mai multe protocoale, fiecare dintre acestea fiind un set de formate, secvențe de schimb și reguli care determină scopul pachetelor De exemplu, atunci când un utilizator dorește să obțină o pagină web de la un server, browserul său trimite către server un pachet cu o solicitare GET PAGE, care "știe" cum să proceseze pachetul primit, folosind HTTP (Nureg-Text Transfer Protocol) ) protocol Procesul de transmisie folosește multe protocoale diferite, adesea în combinație Ele sunt de obicei organizate într-o structură ierarhică stratificată, în care protocoalele de nivel superior trec pachete către protocoalele de nivel inferior, iar protocolul de nivel inferior se ocupă de transferul real de date Pe partea receptorului, pachetele se deplasează în sus în ierarhie în ordine inversă Deoarece procesoarele de rețea sunt ocupate cu executarea protocoalelor, este logic să vorbim despre protocoale mai detaliat înainte de a studia procesoarele Să revenim pentru un moment la solicitarea GET PAGE Cum ajunge exact la serverul web? În primul rând, browserul stabilește o conexiune cu serverul utilizând protocolul de control al transmisiei (TCP) Software-ul care implementează acest protocol asigură că toate pachetele trimise sunt livrate și în ordinea corectă Dacă un pachet este pierdut, software-ul TCP retransmite cât mai repede posibil până când pachetul este în sfârșit primit Ceea ce se întâmplă de fapt este următorul Browserul generează un mesaj HTTP valid cu o solicitare GET PAGE, apoi îl transmite software-ului TCP, care trimite pachetul prin conexiune Software-ul TCP adaugă un antet la începutul mesajului care conține un număr de secvență și alte informații Acest antet suplimentar se numește antet TCP După ce și-a făcut partea, software-ul TCP transmite TCP-per-head împreună cu sarcina utilă (conținând solicitarea GET PAGE) către altcineva Capitolul Arhitecturi de calculatoare paralele un program care implementează protocolul IP (Internet Protocol) Acest program adaugă un antet IP la începutul pachetului cu informații despre adresele expeditorului (adică mașina care transmite pachetul) și destinatarului (mașina care așteaptă pachetul), numărul maxim de hopuri de-a lungul cărora pachetul va exista (pentru ca pachetele "pierdute" să nu trăiască pentru totdeauna, inundând întregul Internet), o sumă de control (pentru detectarea erorilor de memorie și a erorilor de transmisie) și o serie de alte câmpuri Apoi, pachetul (inclusiv antetul IP, antetul TCP și cererea GET PAGE în sine) este transmis la nivelul de legătură de date, care adaugă antetul său la pachet și transmite pachetul prin linia de comunicație Acest strat adaugă și o sumă de control la sfârșit, numită CRC (Cyclic Redundancy Check - verificare ciclică redundanță) și vă permite să detectați erorile de transmisie Poate părea că două sume de control, la nivel de IP și la nivel de legătură de date, sunt mai mult decât necesare, dar această abordare crește fiabilitatea La fiecare hop, se verifică codul CRC al pachetului, după care antetul, împreună cu codul CRC, este regenerat, în conformitate cu cerințele canalului de transmisie a datelor de ieșire Pe fig Figura arată ce este un pachet pe un Ethernet Carcasa liniei telefonice diferă doar prin faptul că există un antet de linie comutată în loc de un antet Ethernet Procesarea antetului este una dintre sarcinile importante pe care procesoarele de rețea sunt proiectate să le rezolve Desigur, este de prisos să menționăm că am atins doar pe scurt subiectul rețelelor de calculatoare Vezi [ ] pentru mai multe detalii Antet Ethernet Antet IP Antet TCP Sarcină utilă C R C Orez Tipul de pachet Ethernet Înțelegerea procesoarelor de rețea O varietate de dispozitive se conectează la rețea Pentru utilizatorii finali, acestea sunt în primul rând computere personale (desktop-uri și laptop-uri), dar și numărul de console de jocuri, secretare electronice personale (PDA-uri), telefoane mobile este în creștere Pentru companii, rolul sistemelor finale este jucat de servere și computere personale În plus, rețelele operează nenumărate dispozitive intermediare diferite, inclusiv routere, comutatoare, firewall-uri, servere proxy, sisteme de echilibrare a încărcăturii În mod curios, aceste sisteme intermediare au cele mai serioase cerințe - trebuie să asigure transmiterea unui număr maxim de pachete pe secundă În plus, serverelor sunt impuse cerințe serioase, deoarece pentru computerele utilizatorilor, nu există cerințe speciale pentru acestea În funcție de rețea și de pachetul în sine, un pachet care intră în rețea poate necesita o anumită procesare înainte de a fi trimis pe linia de ieșire sau transmis către programul de aplicație Procesarea poate include decizia unde să trimiteți pachetul, împărțirea pachetului în părți sau asamblarea acestuia din părți, coprocesoare managementul calității serviciului (în special pentru fluxurile audio și video), protecția datelor (codificare și decodare), compresie și decompresie etc Când rata de date LAN se apropie de Gb/s, iar dimensiunea pachetului se apropie de KB, computerul din rețea trebuie să proceseze aproape milioane de pachete pe secundă Pentru pachetele de de octeți, aceasta crește la aproximativ Mpps Efectuarea tuturor funcțiilor menționate în ordinul a - ns, în plus față de copierea pachetelor necesară invariabil, este pur și simplu imposibil de implementat în software Suportul hardware este esențial aici Una dintre soluțiile hardware la problema procesării rapide a pachetelor este utilizarea circuitelor integrate specifice aplicației (Application-Specific Integrated Circuit, ASIC) Un astfel de microcircuit este ca un program implementat hardware care poate efectua oricare dintre acțiunile predeterminate Baza multor routere moderne sunt circuitele ASIC Cu toate acestea, există unele probleme asociate cu ASIC-urile În primul rând, au nevoie de mult timp pentru proiectare și nu mai puțin pentru a produce În plus, acestea sunt dispozitive hard-coded, adică pentru a introduce o nouă funcționalitate, este necesară dezvoltarea și fabricarea unui nou microcircuit Și mai rău, erorile sunt un adevărat coșmar, deoarece singura modalitate de a le remedia este proiectarea, fabricarea și instalarea unui nou microcircuit (corectat) În cele din urmă, această abordare este foarte costisitoare, cu excepția cazului în care volumul mare de producție poate compensa costurile de dezvoltare A doua abordare se bazează pe utilizarea matricelor de porți programabile în câmp (FPGA) O astfel de matrice este un set de porți, din care circuitul necesar este construit prin recomutație Matricele de porți programabile pe teren au un timp de comercializare mult mai scurt decât ASIC-urile și pot fi reprogramate pe teren cu un programator dedicat Dar, în același timp, ele sunt foarte complexe, costisitoare și mai lente decât circuitele ASIC, astfel încât matricele de porți programabile în câmp nu s-au răspândit, cu excepția unor zone foarte specializate În sfârșit, să trecem la procesoarele de rețea - dispozitive capabile să proceseze pachetele de intrare și de ieșire la rata lor de transmisie, adică în timp real Ele sunt de obicei implementate ca o placă plug-in care conține, pe lângă cipul procesorului de rețea, memorie și logica auxiliară Una sau mai multe linii de rețea sunt conectate la placă Procesorul primește pachete de la linie, le procesează și apoi le transmite pe o altă linie dacă este un router sau le trimite către magistrala principală de sistem (adică către magistrala PCI) dacă este un dispozitiv final, care poate fi, de exemplu, un computer personal Un procesor de rețea tipic și placa sa sunt prezentate în fig De obicei, placa are atât memorie statică (SRAM) cât și memorie dinamică sincronă cu acces aleatoriu (SDRAM) - aceste tipuri de memorie sunt utilizate în scopuri diferite SRAM este mai rapid decât SDRAM, dar datorită costului ridicat al acestui tip de memorie Capitolul Arhitecturi de calculatoare paralele de obicei un pic Este folosit pentru a stoca tabelele de rutare și alte structuri de date cheie, în timp ce pachetele reale care sunt procesate sunt scrise pe SDRAM Deoarece ambele tipuri de memorie se află off-chip pe procesorul de rețea, aveți flexibilitatea de a alege cantitatea de memorie Deci, în sistemele simple cu o singură linie de rețea (astfel de plăci pot fi instalate, de exemplu, într-un computer personal sau un server), poate exista puțină memorie, în timp ce un router are nevoie de mult mai mult RSI Orez Cristal și placa unui procesor de rețea tipic Procesoarele de rețea sunt optimizate pentru a procesa rapid un număr mare de pachete de intrare și de ieșire Aceasta înseamnă că milioane de pachete pe secundă trec prin fiecare dintre liniile de rețea, iar routerul trebuie să accepte zeci de astfel de linii O astfel de performanță serioasă poate fi obținută numai pe procesoare cu un grad ridicat de paralelism intern În plus, procesorul include în mod necesar mai multe controlere PPE (Protocol / Program-mable / Packet Processing Engine - un sistem programabil de procesare a pachetelor și a protocolului), fiecare dintre ele constând dintr-un nucleu RISC (eventual modificat) și o cantitate mică de memorie internă pt program de stocare și mai multe variabile Există două abordări pentru organizarea controlorilor EIP În cel mai simplu caz, toate controlerele EIP sunt fabricate identice Când un nou pachet ajunge la procesorul de rețea, acesta este transmis controlerului PPE care este în prezent inactiv pentru procesare Dacă nu există controlere PPE libere, pachetul este pus în coadă în memoria SDRAM de la bord, așteptând ca unul dintre controlerele PPE să devină liber Cu o astfel de organizare, legăturile orizontale prezentate în Fig lipsesc, deoarece controlorii EIP diferiți nu trebuie să comunice între ei coprocesoare O altă abordare a organizării controlorilor PPE este o conductă, în care fiecare dintre controlorii PPE efectuează o etapă de procesare, după care transmite un pointer către pachetul primit următorului controler PPE din conductă O astfel de conductă funcționează în același mod ca conductele CPU discutate în Capitolul În ambele aranjamente, controlerele PPE sunt complet programabile La procesoarele de rețea mai avansate, controlerele PPE sunt multi-threaded, adică fiecare dintre ele are mai multe seturi de registre și un registru hardware care indică ce set este utilizat Acest lucru permite ca mai multe programe (adică fire de execuție) să ruleze în același timp și să comute între ele pur și simplu schimbând variabila "setul curent de registru de lucru" Când unul dintre firele de execuție a programului este forțat să aștepte (de exemplu, la accesarea SDRAM, care necesită mai multe cicluri), controlerul PPE poate fi comutat instantaneu la un fir care poate continua să funcționeze Acest lucru face posibilă menținerea controlerelor PPE ocupate, chiar dacă adesea trebuie să aștepte finalizarea comunicației SDRAM sau a altor operațiuni externe lente Pe lângă controlerele PPE, toți procesoarele de rețea au un procesor de control pentru a efectua toate acțiunile care nu au legătură directă cu procesarea pachetelor (de exemplu, actualizarea tabelelor de rutare) De obicei, este un procesor RISC de uz general, a cărui memorie pentru date și comenzi se află pe același cip cu procesorul Mai mult, un procesor de rețea poate avea mai multe procesoare specializate dedicate operațiunilor critice Sunt circuite integrate specifice aplicației (ASIC) foarte mici, capabile să efectueze o singură acțiune simplă, cum ar fi căutarea unei adrese de destinație într-un tabel de rutare Toate componentele procesorului de rețea comunică între ele la viteze multi-gigabit prin una sau mai multe magistrale paralele pe cip Procesarea pachetelor Indiferent dacă procesorul de rețea are o organizare pipeline sau paralelă, fiecare pachet care sosește trece prin mai multe etape de procesare Pentru unele procesoare, aceste etape sunt împărțite în procesare de intrare (procesare de intrare) și procesare de ieșire (procesare de ieșire) Primul grup include operațiuni cu pachete care au venit din exterior (printr-o linie de rețea sau magistrală de sistem), iar al doilea grup include operațiuni cu pachete înainte ca acestea să fie trimise Astfel, fiecare pachet este supus mai întâi procesării de intrare și apoi procesării de ieșire Această împărțire este destul de arbitrară, deoarece unele operațiuni pot fi efectuate în orice etapă (de exemplu, colectarea de informații despre trafic) Vom parcurge acești pași în ordinea în care ar putea fi făcute, dar rețineți că nu toate pachetele trebuie să le parcurgă și este posibilă o altă secvență de pași Verificarea sumei de control Dacă un pachet de intrare sosește dintr-o rețea Ethernet, suma sa de control (codul CRC) este recalculată și comparată cu valoarea prezentă în pachet pentru a se asigura că pachetul a fost primit fără erori Capitolul Arhitecturi de calculatoare paralele Dacă ambele valori sunt egale sau dacă nu există un câmp CRC în pachetul Ethernet, suma de control a pachetului IP este calculată și comparată cu valoarea din pachet Acest lucru asigură că pachetul IP nu a fost corupt de un bit rău din memoria expeditorului după ce expeditorul a calculat suma de control pentru pachetul IP Dacă toate verificările sunt trecute, pachetul este trecut pentru procesare ulterioară, în caz contrar, este pur și simplu aruncat Extragerea valorilor câmpului Prin parsare, se determină poziția antetului necesar, iar valorile câmpurilor cheie corespunzătoare acestui antet sunt extrase din pachet Într-un comutator Ethernet, este examinat doar antetul Ethernet; într-un router IP, numai antetul IP Valorile câmpurilor cheie sunt stocate fie în registre (cu organizare paralelă a controlerelor PPE), fie în SRAM (cu organizare pipeline) Clasificarea pachetelor Pachetele sunt clasificate conform unui set de reguli de programare În cel mai simplu caz, pachetele de date sunt separate de pachetele de control, dar separarea este de obicei mult mai subtilă Alegerea căii Majoritatea procesoarelor de rețea au o cale rapidă specială, care este optimizată pentru a transporta întreaga varietate de pachete de date, în timp ce restul pachetelor sunt procesate în felul lor, de obicei de către procesorul de control În consecință, trebuie aleasă fie calea rapidă, fie una dintre căile lente Definirea retelei tinta Pachetele IP conțin o adresă de destinație pe de biți Cu toate acestea, este imposibil (și nedorit) să folosiți un întreg tabel de de intrări pentru a găsi destinatarul fiecărui pachet Prin urmare, partea stângă a adresei conține de obicei adresa rețelei, în timp ce partea dreaptă indică către o singură mașină din acea rețea Lungimea adresei de rețea nu este fixă, așa că determinarea acesteia nu este o sarcină banală și este și mai complicată de faptul că sunt permise mai multe opțiuni, dintre care cea mai lungă este considerată corectă Acest pas folosește adesea un ASIC Căutare rută După determinarea adresei rețelei țintă dintr-un tabel stocat în SRAM, rezultă care dintre liniile de ieșire trebuie să trimită pachetul Din nou, un ASIC poate fi folosit în acest pas Avarie si montaj Aplicațiile maximizează adesea sarcina utilă (date) pachetelor TCP în încercarea de a reduce numărul de apeluri de sistem, dar atât TCP, IP, cât și Ethernet au limite privind dimensiunea maximă a pachetului Ca o consecință a acestor limitări, poate fi necesară împărțirea pachetelor (și, prin urmare, încărcarea utilă) în bucăți înainte de a le trimite și reasamblarea lor la capătul de primire Aceste funcții pot fi efectuate de procesorul de rețea Calcule Uneori este necesar să se efectueze anumite calcule complexe asupra datelor, de exemplu, să se efectueze compresie și decompresie, codificare și decodare Aceste acțiuni pot fi transferate către procesorul de rețea coprocesoare Gestionați anteturile Uneori trebuie să adăugați sau să eliminați anteturi, precum și să modificați valorile anumitor câmpuri De exemplu, în antetul IP există un contor al numărului de hopuri pe care pachetul le poate trece înainte de a se autodistruge După trecerea fiecărui hop, valoarea contorului trebuie redusă cu , iar această funcție poate fi îndeplinită de procesorul de rețea Managementul cozilor Pachetele de intrare și de ieșire trebuie adesea să stea la coadă pentru a fi procesate Dar pentru aplicațiile multimedia, pentru a evita jitterul, este necesar ca întârzierile dintre pachete să nu depășească o anumită valoare În plus, un firewall sau un router poate avea nevoie să redistribuie sarcina de intrare între mai multe linii de ieșire conform anumitor reguli Toate aceste sarcini pot fi rezolvate de procesorul de rețea Generarea de sume de control Pachetele de ieșire trebuie să aibă sume de control Suma de control a pachetelor IP poate fi calculată de procesorul de rețea, în timp ce suma de control a pachetelor Ethernet este, în general, generată de hardware Contabilitate În unele cazuri, este necesar să se contorizeze traficul pe măsură ce acesta trece pachete, mai ales dacă una dintre rețele oferă tranzitul traficului ca serviciu comercial Contabilitatea poate fi gestionată de procesorul de rețea Culegerea de statistici Multe companii ar dori să aibă statistici de trafic, iar procesoarele de rețea pot colecta aceste informații Creșterea productivității Performanța este cea mai importantă caracteristică a procesoarelor de rețea Ce se poate face pentru a-l îmbunătăți? Înainte de a răspunde la această întrebare, este necesar să definim ce este Una dintre metrici este numărul de pachete transmise pe secundă, cealaltă este numărul de octeți transmiși pe secundă Aceste valori au abordări diferite, iar o schemă care funcționează bine cu pachetele mici poate să nu funcționeze bine cu cele mari În special, atunci când transmiteți pachete mici, puteți îmbunătăți considerabil performanța prin accelerarea căutării adresei țintă în tabel, în timp ce, în același timp, atunci când transmiteți pachete mari, acest lucru nu va oferi o creștere vizibilă a performanței Cea mai directă modalitate de a îmbunătăți performanța este creșterea frecvenței de ceas a procesorului de rețea Adevărat, performanța nu crește proporțional cu frecvența, deoarece timpul de acces la memorie și o serie de alți factori afectează În plus, o frecvență mai mare înseamnă că trebuie disipată mai multă căldură De obicei, soluția este creșterea numărului de controlere PPE - această abordare este eficientă în special pentru arhitecturile paralele Creșterea lungimii conductei poate ajuta, de asemenea, dar numai dacă este posibilă împărțirea procesului de procesare a unui pachet în pași destul de simpli O altă abordare este creșterea numărului de procesoare suplimentare specifice aplicației sau de circuite integrate specifice aplicației dedicate anumitor operațiuni costisitoare și solicitate frecvent, dacă astfel de operațiuni sunt efectuate mai eficient în hardware Printre multi Capitolul Arhitecturi de calculatoare paralele candidații includ căutări în tabele, sume de verificare și operațiuni criptografice De asemenea, puteți crește viteza prin reducerea timpului de tranzit al pachetelor în sistem prin introducerea de autobuze suplimentare și creșterea numărului de linii în cele existente În cele din urmă, câștigurile de performanță pot fi obținute de obicei prin înlocuirea cipurilor de memorie (SRAM în loc de SDRAM), dar acest lucru, desigur, afectează costul Desigur, acest lucru nu este tot ce se poate spune despre procesoarele de rețea Pentru mai multe informații, vezi [ , , , ] procesoare multimedia Un alt domeniu de aplicare a coprocesoarelor este procesarea imaginilor fotografice de înaltă rezoluție, precum și a fluxurilor audio și video De obicei, procesorul nu este suficient de bun atunci când aceste aplicații trebuie să efectueze calcule complexe pe cantități mari de date Din acest motiv, unele calculatoare personale moderne și majoritatea modelelor aflate în curs de dezvoltare sunt echipate cu coprocesoare speciale pentru procesarea informațiilor multimedia, pe care poate fi deplasată o parte semnificativă a muncii procesoare multimedia Nexiperia Vom studia zona de procesare a informațiilor multimedia, a cărei importanță este în continuă creștere, folosind exemplul procesoarelor Nexiperia fabricate de Philips - aceasta este o familie de microcircuite pentru diferite frecvențe de ceas Nexiperia este un multiprocesor eterogen autonom cu un singur cip (vezi, de exemplu, procesorul din Figura ) Conține mai multe nuclee, inclusiv procesorul de control TriMedia VLIW și nuclee separate pentru operațiuni de imagine, audio, video și rețea Nexiperia poate fi folosit și ca procesor de sine stătător pentru CD, DVD, player MP , receptor TV, cameră foto sau video etc În plus, poate juca rolul unui coprocesor conceput pentru a procesa imagini și fluxuri multimedia ca parte a unui proces personal calculator În orice configurație, procesorul Nexiperia rulează propriul sistem de operare miniatural în timp real Nexiperia rezolvă trei probleme: capturarea datelor de intrare și convertirea lor în structuri de memorie, procesarea acestor structuri și, în final, scoaterea datelor într-o formă potrivită pentru dispozitivele conectate De exemplu, atunci când un computer este utilizat ca DVD player, co-procesorul Nexiperia poate fi programat să citească un flux video comprimat codificat de pe un DVD, să îl decodifice, să îl decomprimați și să îl scoată la dimensionarea imaginii pentru a se potrivi cu ieșirea fereastră Odată ce software-ul playerului DVD este încărcat în Nexiperia, totul se întâmplă în fundal, fără a fi nevoie de un procesor Toate datele primite sunt mai întâi stocate în memorie pentru procesare, adică nu există o legătură directă între sursele și receptorii de informații Captura de intrare se referă la decodarea videoclipurilor coprocesoare dimensiuni și formate (inclusiv MPEG- , MPEG- și MPEG- ) și audio (inclusiv AAC, Dolby și MP ), precum și stocarea datelor decodificate ca structuri adecvate în memorie pentru ieșirea și procesarea ulterioară Datele de intrare pot veni de la magistrala PCI, de la o rețea Ethernet sau printr-o intrare specială (când un microfon sau un sistem stereo este conectat direct la cip) Cipul Nexiperia are de pini, dintre care unii vă permit să primiți și să transmiteți direct fluxuri multimedia (și altele) Prelucrarea datelor este controlată de procesorul central TriMedia, care poate fi programat pentru orice sarcină Sarcinile tipice sunt îmbunătățirea clarității, luminozității, contrastului și reproducerii culorilor, scalarea imaginii, conversia formatului video, reducerea zgomotului În mod obișnuit, procesorul acționează ca un antreprenor general, delegând cea mai mare parte a muncii unor nuclee specializate de microcipuri Funcțiile de ieșire includ conversia structurilor de date într-o formă potrivită pentru dispozitive de recepție, combinarea mai multor surse de date (video, audio, imagini, grafică D) și gestionarea dispozitivelor de ieșire Pe lângă intrarea datelor, ieșirea poate fi prin magistrala PCI, o rețea Ethernet sau fire separate (conectate la difuzoare sau la un amplificator, de exemplu) Schema bloc a procesorului PNX din familia Nexiperia este prezentată în fig Alte procesoare din această familie sunt ușor diferite, așa că în viitor, sub numele Nexiperia, vom înțelege procesorul PNX Procesorul PNX are patru secțiuni principale responsabile de control, intrare, procesare și ieșire Rolul procesorului central este jucat de un procesor TriMedia VLIW pe de biți care funcționează la o frecvență de MHz Funcționalitatea procesorului este definită de un program, de obicei scris în C sau C++ În afară de două cache-uri în procesorul TriMedia, nu există memorie pe cipul Nexiperia În schimb, există o interfață pentru conectarea de la la MB de memorie DDR SDRAM - o memorie destul de comună pentru aplicațiile multimedia La o frecvență de ceas de MHz, lățimea de bandă a memoriei este de , Gb/s Pe lângă interfața de memorie, cipul este echipat cu o interfață PCI cu funcții complete pentru , și de biți și o frecvență de MHz Când funcționează ca procesor principal în interiorul unui dispozitiv electronic, interfața PCI poate acționa ca un arbitru de magistrală Această interfață poate fi utilizată, de exemplu, pentru a interacționa cu o unitate DVD Conectivitatea Ethernet directă este asigurată de un nucleu dedicat care gestionează conexiuni Ethernet de și Mbps În consecință, o cameră video bazată pe procesorul Nexiperia poate difuza direct un flux video digital prin Ethernet către un dispozitiv de înregistrare sau ieșire video de la distanță Următorul nucleu este responsabil pentru încărcare, resetare, sincronizare și alte câteva funcții Dacă se primește un semnal pe un anumit pin, se inițiază o resetare a procesorului Nucleul poate fi programat și ca temporizator de supraveghere, permițându-i să inițieze o repornire a procesorului dacă nu răspunde într-un interval de timp stabilit Dispozitivele autonome pot reporni din memoria flash Capitolul Arhitecturi de calculatoare paralele Orez Multiprocesor heterogen Nexiperia cu un singur cip Nucleul este condus de un oscilator cu cristal de MHz, care este înmulțit cu pentru a produce un semnal de , GHz care este utilizat în întregul procesor În mod obișnuit, procesorul funcționează la viteză maximă, iar restul componentelor funcționează la orice viteză de care au nevoie pentru a-și îndeplini sarcinile Pentru a economisi energie, este posibilă reducerea frecvenței În plus, există un mod de repaus în care majoritatea funcțiilor sunt dezactivate - acest lucru vă permite să economisiți energia bateriei pe dispozitivele mobile atunci când sunt inactiv Acest nucleu are și "semafore" care pot fi folosite pentru sincronizarea dispozitivelor Când unui semafor care are o valoare zero i se atribuie un număr diferit de zero de către nucleu, scrierea reușește, în caz contrar, scrierea eșuează și vechea valoare a semaforului rămâne neschimbată Scrierea zero reușește întotdeauna Deoarece doar unul dintre nuclee poate folosi magistrala la un moment dat, operațiunile de scriere sunt atomice, iar semaforele oferă tot ceea ce este necesar pentru a împiedica mai multe nuclee să folosească magistrala în același timp Pentru a accesa o resursă, nucleul încearcă să scrie o valoare non-nulă la un anumit semafor Dacă scrierea are succes, atunci kernel-ul preia accesul la dispozitiv, pentru a elibera care zero este scris pe semafor Dacă capturarea eșuează, nucleul reîncearcă periodic Astfel, aceste semafoare sunt oarecum diferite de semaforele clasice discutate în Capitolul coprocesoare Să trecem la secțiunea de introducere Miezul de intrare video primește un flux video digital de biți, îl convertește în biți folosind un algoritm de anti-aliasing și îl scrie într-o memorie SDRAM externă În cele mai multe cazuri, fluxul video digital de intrare este semnalul de ieșire al unui convertor extern analog-digital, care este alimentat cu un semnal de televiziune analogic, terestru sau prin cablu Nucleul de intrare de bază vă permite să capturați date nestructurate pe de biți dintr-o sursă arbitrară și să le stocați în memoria SDRAM Frecvența magistralei este de MHz În plus, nucleul poate captura date structurate cu etichete care indică limitele înregistrărilor Routerul care precede cele două nuclee de intrare video separă semnalul de intrare și poate efectua, de asemenea, unele conversii video din mers Separarea este necesară deoarece aceiași pini externi sunt utilizați atât pentru intrarea video, cât și pentru intrarea de bază Nucleul de intrare audio este capabil să capteze până la canale de muzică stereo sau voce la digitizare pe , sau de biți la până la kHz și să stocheze datele audio în memoria SDRAM În plus, nucleul poate decomprima formate comprimate, poate amesteca canale, poate modifica rata de eșantionare și poate aplica filtre din mers înainte de a salva datele audio Nucleul de intrare digitală SP vă permite să primiți un semnal audio digital care respectă standardele Sony-Philips (IEC ) Un semnal audio digital poate fi transferat de la un dispozitiv la altul fără pierderi de calitate De obicei, după ce sunt primite date audio, video sau orice alte date, acestea trebuie procesate, ceea ce este responsabilitatea următoarei secțiuni a procesorului Filmele DVD sunt criptate pentru protecție împotriva copierii Decodorul DVD efectuează decodarea pentru a obține videoclipul original MPEG- Decriptarea este o operație de la memorie la memorie în care intrarea provine dintr-un buffer și rezultatul este scris în altul Decodorul de lungime continuă decodarea începută de nucleul anterior, evitând efectele codificării cu lungime variabilă a cuvântului care este comună cu MPEG- (și MPEG- ) Ca rezultat, este posibil să se obțină date pe jumătate decomprimate, care sunt apoi transferate în nucleul de procesare în format MPEG (în TriMedia este implementat în software), unde are loc decodarea finală Motivul acestei separări este că procesul de decodare cu lungime variabilă a cuvintelor (bazat pe decodarea Huffman și decodificarea grupurilor) nu utilizează capabilitățile TriMedia foarte eficient, așa că a fost considerat rezonabil să cheltuiți câțiva milimetri pătrați de siliciu pentru implementarea hardware a acest algoritm Ca rezultat, aceste două operații fac posibilă obținerea unei hărți complete de pixeli în memorie O hartă de pixeli poate fi prezentată în unul dintre cele trei formate principale, fiecare dintre ele având trei sau patru opțiuni care diferă ca parametri Primul format, numit culoare indexată, utilizează un tabel de căutare a culorilor (CLUT) Direct în acest tabel sunt stocate valori de culoare pe de biți, completate de o mască de canal alfa de biți În formatul RGB în care funcționează monitorul, intensitățile canalelor roșu, verde și albastru sunt indicate separat Capitolul Arhitecturi de calculatoare paralele culorile Formatul YUV corespunde modului în care sunt codificate semnalele de televiziune În acest format, în loc să codifice direct componentele roșii, verzi și albastre, se face o conversie în cameră, rezultând un canal de luminanță și două canale de crominanță Sistemul permite alocarea unei mari părți a lățimii de bandă canalului de luminanță, ceea ce oferă o rezistență mai bună la zgomotul de transmisie Formatul YUV are sens să fie utilizat în aplicații legate de semnalul de televiziune și televiziune Datorită faptului că imaginea este prezentată în doar câteva formate cu variantele lor, fiecare dintre nucleele procesorului "înțelege" rezultatele muncii altor nuclee Motorul de scalare video, cu o viteză maximă de megapixeli pe secundă, primește și execută sarcini de scalare, printre care se numără: ♦ eliminarea efectului "pieptene"; ♦ scalare orizontală și verticală; ♦ transformare liniară și neliniară a dimensiunii cadrului; ♦ conversie între diferite formate de culoare; ♦ construirea unei histograme de luminozitate; ♦ eliminarea pâlpâirii În televiziunea difuzată, așa-numitul efect "pieptene" apare la digitizarea unui semnal de televiziune analogică, când pentru fiecare cadru format din de linii ( pentru formatele PAL și SECAM), sunt transmise mai întâi toate liniile pare și apoi toate imparele După eliminarea efectului "pieptene", se obține o imagine de scanare progresivă mai bună (scanare progresivă) atunci când liniile sunt transmise sau procesate în ordinea lor adevărată, iar rata de cadre este de două ori mai mare ( , fps pentru NTSC și fps pentru PAL și SECAM) decât cu scanarea intercalată Prin scalarea orizontală și verticală, puteți reduce sau mări dimensiunea imaginii, eventual după tăiere Televizorul standard folosește un cadru cu un raport lățime/înălțime de / , în timp ce televizorul cu ecran lat folosește un raport de cadru de / , care se potrivește mai bine cu raportul de / al unui cadru de film de mm Nucleul de scalare vă permite să schimbați formatul cadrului conform unui algoritm liniar sau neliniar În plus, poate converti diferite formate de culoare (culori indexate, RGB și YUV) între ele, precum și poate construi o histogramă de luminozitate, care poate fi utilă pentru îmbunătățirea calității imaginii de ieșire În cele din urmă, anumite conversii pot fi efectuate pentru a elimina pâlpâirea Motorul de procesare grafică construiește imagini ale obiectelor bidimensionale conform descrierilor acestora În plus, poate umple zonele închise cu culoare și poate efectua operații grafice bitblt, care se rezumă la faptul că hărțile de pixeli corespunzătoare sunt combinate folosind AND, OR, XOR sau alte funcții booleene coprocesoare Nu există nuclee separate pentru procesarea datelor audio Sunt necesare atât de puține date pentru a stoca sunetul, încât acesta poate fi procesat de software, ceea ce se întâmplă în procesorul TriMedia De asemenea, multe aplicații nu trebuie deloc să proceseze sunetul, cu excepția, poate, a modificărilor de format Nucleul de depanare este conceput pentru a ajuta dezvoltatorii să depaneze software-ul și hardware-ul procesorului Acest nucleu oferă o interfață cu facilitățile JTAG (Joint Test Action Group) așa cum sunt definite în standardul IEEE Secțiunea de ieșire este responsabilă pentru citirea datelor procesate din memorie și scoaterea lor Nucleul video compozit normalizează și combină una sau mai multe structuri de date pixeli înainte de ieșire Culorile indexate sunt "de-indexate" în pixeli reali din mers, iar pentru formatele incompatibile, motorul video compozit realizează o pre-conversie În plus, acest nucleu realizează corectarea luminozității și contrastului dacă este necesar, acceptă funcția cheie cromatică, atunci când imaginea unui actor filmată pe un fundal albastru uniform este apoi separată de fundal și plasată deasupra unei scene preluate dintr-o altă sursă În mod similar, puteți crea o animație în care un personaj animat din prim-plan se mișcă pe un fundal staționar sau cu derulare uniformă Rezultatul final al nucleului, desigur, este convertit în formatul video sau de televiziune necesar (NTSC, PAL sau SECAM), incluzând, printre altele, impulsuri de sincronizare verticale și orizontale Este de așteptat ca majoritatea sistemelor bazate pe procesorul Nexiperia să poată recunoaște automat toate cele trei formate de televiziune, deoarece nu există costuri suplimentare pentru aceasta, iar dispozitivele pot fi vândute în toată lumea fără modificări În mod similar, suportul pentru televiziunea de înaltă definiție (High Definition TeleVision, HDTV) necesită doar o ușoară complicație a codului programului, care trebuie să convertească datele video în structuri de memorie și invers Nucleul de ieșire de bază transferă date doar la , sau de biți pe ciclu la MHz, rezultând un debit maxim de , Gbps Conectând ieșirea unui procesor Nexiperia la intrarea altuia, puteți transfera fișiere între ele la o viteză mai mare decât o permite Gigabit Ethernet ( Gb/s) În plus, pe această interfață, procesorul central poate genera programatic orice semnale necesare Routerul de ieșire determină care dintre cele două nuclee de ieșire ar trebui să fie transmisă la pinii procesorului și poate efectua, de asemenea, unele acțiuni suplimentare Acestea includ o rată de reîmprospătare de Hz pentru panourile TFT de până la x pixeli, precum și imagini TV întrețesate sau cu scanare progresivă Nucleul de ieșire audio poate genera până la canale stereo de audio cu precizie de de biți și frecvență de eșantionare de până la kHz De obicei, această ieșire comandă un convertor extern digital-analogic Ieșirea digitală SP poate fi conectată la dispozitive care acceptă standardul audio digital Sony-Philips Capitolul Arhitecturi de calculatoare paralele Ultimul nucleu rămas este responsabil pentru intrarea și ieșirea semnalelor de uz general Cei pini ai acestui nucleu pot fi folosiți în orice scop, de exemplu, pot fi conectați la butoane, întrerupătoare, LED-uri și pot lucra programatic cu ele În plus, acești pini pot fi utilizați pentru protocoale de rețea de viteză medie ( MB/s) controlate de software De asemenea, în acest nucleu există diverse cronometre, contoare și handlere de evenimente În general, putem spune că procesorul Nexiperia are o putere de procesare uriașă pentru aplicațiile audiovizuale și, la fel ca procesoarele de rețea, poate lua o parte semnificativă din sarcina procesorului Puterea de procesare a acestui coprocesor este chiar mai mare decât pare la prima vedere, deoarece toate nucleele pot funcționa simultan între ele și cu procesorul central După ce am studiat Nexiperia, capacitățile coprocesoarelor, în special cele bazate pe cipuri multiprocesoare eterogene, devin mai ușor de înțeles Un procesor similar, dar concentrat nu pe multimedia, ci pe telefonie, este considerat în [ ] Procesoare cripto Securitatea, și în special securitatea rețelei, este un alt domeniu (deja al treilea) în care coprocesoarele sunt utilizate pe scară largă Când se stabilește o conexiune între un client și un server, acestea necesită de obicei autentificare reciprocă Folosind o conexiune sigură (criptată) stabilită în acest fel, puteți transfera date în siguranță și nu vă gândiți la intrușii care ascultă linia Problema aici este că securitatea este asigurată prin intermediul criptografiei, iar această zonă necesită calcule foarte voluminoase În criptografie, două abordări principale ale protecției datelor sunt acum comune: criptarea cheii simetrice și criptarea cheii publice Primul se bazează pe o amestecare foarte minuțioasă a biților (ca și cum mesajul ar fi plasat într-un fel de mixer electronic) A doua abordare se bazează pe înmulțirea și exponențiarea numerelor mari ( de biți), care este extrem de consumatoare de timp Multe companii au lansat coprocesoare criptografice care permit ca datele să fie criptate pentru transmisie sigură și apoi decriptate Adesea sunt plăci de expansiune introduse în slotul PCI Datorită hardware-ului special, aceste procesoare pot efectua calculele criptografice necesare mult mai rapid decât unitatea centrală de procesare Din păcate, un studiu mai detaliat al procesoarelor criptografice ar necesita mult timp pentru criptografia în sine, ceea ce depășește scopul acestei cărți Informații suplimentare pot fi găsite în [ , ] Multiprocesoare Ne-am dat seama cum să introducem paralelismul într-un sistem uniprocesor prin adăugarea unui coprocesor la acesta Următorul pas este să combinați mai multe procesoare cu drepturi depline într-un singur sistem mare Astfel de sisteme cu mai multe centrale Multiprocesoare procesoarele pot fi împărțite în multiprocesoare și multicalculatoare În primul rând, după ce am înțeles sensul acestor termeni, vom studia multiprocesoarele, iar după ele - multicomputere Multiprocesoare și multicalculatoare În orice sistem computerizat paralel, procesoarele care efectuează diferite părți ale unei singure sarcini trebuie cumva să interacționeze între ele pentru a face schimb de informații Cum ar trebui să aibă loc mai exact schimbul? Pentru aceasta, au fost propuse și implementate două strategii: multiprocesoare și multicalculatoare Diferența cheie dintre strategii este prezența sau absența memoriei partajate Această diferență afectează atât proiectarea, proiectarea și programarea unor astfel de sisteme, cât și costul și dimensiunea acestora Multiprocesoare Un computer paralel în care toate procesoarele au o memorie fizică comună se numește multiprocesor sau sistem de memorie partajată (Figura a) Toate procesele care lucrează împreună într-un multiprocesor pot avea un singur spațiu de adrese virtuale mapat la o memorie partajată Orice proces care utilizează comenzile LOAD și STORE poate citi un cuvânt din memorie sau poate scrie un cuvânt în memorie Nimic altceva nu este necesar Două procese au capacitatea de a schimba cu ușurință informații - pentru aceasta, unul dintre ele pur și simplu scrie date în memoria partajată, iar celălalt le citește Orez Multiprocesor cu procesoare care partajează memorie (a); imagine împărțită în secțiuni, fiecare dintre ele analizată de un procesor separat (b) Datorită posibilității de interacțiune între două sau mai multe procese, multiprocesoarele sunt foarte populare Acest model este de înțeles programatorilor și permite rezolvarea unei game largi de probleme De exemplu, luați în considerare un program care analizează un bitmap și listează toate obiectele sale O copie a imaginii este stocată în memorie, așa cum se arată în Fig b Fiecare dintre cele procesoare rulează un proces, conceput pentru a analiza una dintre cele secțiuni Dacă un proces detectează că unul dintre obiectele sale trece prin Capitolul Arhitecturi de calculatoare paralele secțiunea, acest proces pur și simplu urmărește obiectul în secțiunea următoare, citind cuvintele acestei secțiuni În exemplul nostru, unele obiecte sunt procesate prin mai multe procese, așa că va fi necesară o anumită coordonare la sfârșit pentru a determina numărul de case, copaci și avioane Deoarece toate procesoarele dintr-un multiprocesor folosesc același spațiu de adrese, rulează o singură copie a sistemului de operare În consecință, există o singură hartă a paginii de memorie și un tabel de proces Când un proces se blochează, procesorul său își salvează starea în tabelele sistemului de operare și apoi caută în acele tabele un alt proces pentru a rula Această organizație, care se bazează pe un singur sistem, este cea care distinge un multiprocesor de un multicomputer Multiprocesorul, ca toate computerele, trebuie să conțină dispozitive de intrare-ieșire (discuri, adaptoare de rețea etc ) În unele sisteme multiprocesor, doar anumite procesoare au acces la dispozitivele I/O și, prin urmare, au facilități speciale de I/O În alte sisteme multiprocesor, fiecare procesor poate accesa orice dispozitiv I/O Dacă toate procesoarele au acces egal la toate modulele de memorie și la toate dispozitivele I/O și este posibilă interschimbabilitatea completă între procesoare, un astfel de multiprocesor se numește simetric (Symmetric MultiProcessor, SMP) Multicalculatoare În cea de-a doua versiune a arhitecturii paralele, fiecare procesor are propria sa memorie disponibilă doar pentru acest procesor O astfel de schemă se numește multicomputer sau sistem de memorie distribuită (Fig , a) Diferența cheie dintre un multicomputer și un multiprocesor este că fiecare procesor dintr-un multicomputer are propria sa memorie locală, pe care acest procesor o poate accesa executând instrucțiunile LOAD și STORE, dar niciun alt procesor nu poate accesa memoria locală a acestui procesor folosind aceste instrucțiuni Astfel, multiprocesoarele au un spațiu de adrese fizice partajat de toate procesoarele, în timp ce multicalculatoarele au spații de adrese fizice separate pentru fiecare procesor Deoarece procesoarele dintr-un multicomputer nu pot comunica între ele prin simple accese la memoria partajată, procesoarele fac schimb de mesaje prin intermediul rețelei de comunicații care le leagă Exemple de multicomputere includ IBM BlueGene/L, Red Storm și clusterul Google În absența memoriei partajate implementată în hardware, se presupune o anumită structură software Într-un multicomputer, este imposibil să existe un singur spațiu de adrese virtuale pentru toate procesoarele care să permită citirea și scrierea informațiilor cu comenzi LOAD și STORE De exemplu, dacă procesorul din colțul din stânga sus al Fig b (să dăm acestui procesor numărul ) constată că o parte din obiectul său se încadrează într-o altă secțiune legată de următorul procesor (să fie procesorul ), pur și simplu poate continua să citească informații din memorie pentru a obține o imagine a cozii aeronave Totuși, dacă procesorul din Fig , b, Multiprocesoare nu poate citi pur și simplu informații din memoria procesorului În acest caz, algoritmul de achiziție a datelor trebuie să fie diferit Orez Multicomputer cu procesoare, fiecare cu memorie(i) proprie; bitmap al imaginii din fig împărțit între module de memorie (b) În primul rând, procesorul trebuie să afle cumva care procesor conține datele de care are nevoie și să trimită un mesaj acelui procesor solicitând o copie a datelor Procesorul se blochează apoi până când este primit un răspuns Când procesorul primește un mesaj, acesta este analizat de software, după care datele solicitate sunt trimise înapoi Când procesorul primește un mesaj de răspuns, blocarea este eliberată de software și procesorul continuă să ruleze Într-un multicomputer, primitivele de trimitere și recepție sunt adesea folosite pentru a comunica între procesoare Prin urmare, software-ul multicomputer are o structură mai complexă decât software-ul multiprocesor În acest caz, principala problemă este distribuirea corectă a datelor și plasarea lor rezonabilă Aceasta este o altă diferență între un multicomputer și un multiprocesor, unde plasarea datelor nu afectează corectitudinea soluționării problemei, deși poate afecta performanța Pe scurt, un multicomputer este mult mai greu de programat decât un multiprocesor Apare întrebarea: de ce să creați mai multe computere, dacă multiprocesoarele sunt mult mai ușor de programat? Răspunsul este simplu: construirea unui multicomputer mare este mai ușoară și mai ieftină decât construirea unui multiprocesor cu același număr de procesoare Implementarea unei memorie partajată partajată de câteva sute de procesoare este o provocare, dar proiectarea unui multicomputer cu sau mai multe procesoare este destul de ușoară Mai târziu, în acest capitol, ne vom uita la un multicomputer cu mai mult de de procesoare Astfel, ne confruntăm cu o dilemă: multiprocesoarele sunt greu de proiectat, dar ușor de programat, iar multicalculatoarele sunt ușor de construit, dar Capitolul Arhitecturi de calculatoare paralele greu de programat Ca urmare, se încearcă în mod constant crearea de sisteme hibride Aceste încercări au condus la realizarea că memoria partajată poate fi implementată în moduri diferite, fiecare opțiune având avantaje și dezavantaje Aproape toate cercetările din domeniul arhitecturilor de computere paralele vizează crearea de forme hibride care să combină avantajele ambelor sisteme Aici este important să se obțină scalabilitate, adică să se dezvolte un sistem care va continua să funcționeze corect cu adăugarea a tot mai multe procesoare Una dintre abordări se bazează pe faptul că sistemele informatice moderne nu sunt monolitice, ci au o structură pe mai multe niveluri Acest lucru face posibilă implementarea memoriei partajate la oricare dintre mai multe niveluri, așa cum se arată în Fig Pe fig , și vedem memoria partajată implementată în hardware, ca într-un multiprocesor "adevărat" În această dezvoltare, există o copie a sistemului de operare cu un set de tabele, în special tabelul de alocare a memoriei Dacă un proces are nevoie de mai multă memorie, acesta întrerupe sistemul de operare, care apoi caută în tabel o pagină liberă și mapează pagina respectivă la spațiul de adrese al procesului apelant În ceea ce privește sistemul de operare, există o singură memorie, iar sistemul de operare ține evidența ce pagină aparține cărui proces Există multe modalități de implementare a memoriei partajate în hardware A doua abordare este utilizarea hardware-ului multicomputer și a unui sistem de operare care va modela memoria partajată prin furnizarea unui singur spațiu de adrese virtuale paginat Cu această abordare, obținem o memorie distribuită partajată (DSM), în care fiecare pagină este situată într-unul dintre modulele de memorie (vezi Fig , a), iar fiecare mașină conține propria sa memorie virtuală și propriile tabele de pagini [ ] Dacă procesorul execută o instrucțiune LOAD sau STORE în timp ce accesează o pagină pe care nu o are, apare o excepție de sistem Sistemul de operare găsește apoi pagina dorită și apelează procesorul corespunzător pentru a descărca pagina din memorie și a o trimite prin rețeaua internă de comunicații prin care procesoarele fac schimb de mesaje Când pagina ajunge la procesul de primire, este mapată în memorie și execuția comenzii întrerupte se reia În esență, sistemul de operare pur și simplu primește paginile lipsă nu de pe disc, ci din memorie Acest lucru dă utilizatorului impresia că aparatul are o singură memorie partajată Vom reveni la memoria partajată distribuită mai târziu în acest capitol A treia abordare este implementarea memoriei partajate în software de către un sistem de utilizator în timp real Cu această abordare, limbajul de programare creează o abstracție a memoriei partajate, iar această abstracție este implementată de compilator (adică modelul de memorie partajată poate depinde de limbajul de programare utilizat) De exemplu, modelul Linda se bazează pe abstractizarea unui spațiu comun de tupluri (înregistrări de date care conțin seturi de câmpuri) Procesele de pe orice mașină pot lua un tuplu din spațiul partajat sau îl pot trimite în spațiul partajat Deoarece accesul la acest spațiu este controlat complet de software (sistemul în timp real Linda), nu este necesar nici un suport hardware special sau un sistem de operare special Procesoare multiple Mașina Mașina Mașina Mașina Mașina Masina Aplicație Aplicație Aplicație Aplicație Aplicație Sistem în timp real utilizator Sistem în timp real utilizator Sistem în timp real utilizator Sistem în timp real utilizator Sistem în timp real utilizator Sistem în timp real utilizator Sistem de operare Sistem de operare Sistem de operare Sistem de operare Sistem de operare Sistem de operare Hardware Hardware Hardware Hardware Hardware Hardware Memorie partajată Memoria partajată Memoria partajată a B C Orez Niveluri la care poate fi implementată memoria partajată: implementare hardware (a); sistemul de operare (b); implementare software (c) Un alt exemplu de memorie partajată implementat de un sistem personalizat în timp real este Modelul obiectelor de date partajate în sistemul Orcs În modelul Ogsa, procesele nu împărtășesc tupluri, ca în Linda, ci obiecte de bază apelând metode pe ele Dacă o metodă modifică starea internă a unui obiect, sistemul în timp real trebuie să se asigure că toate copiile acelui obiect de pe toate mașinile sunt modificate în același timp Din nou, deoarece obiectele sunt un concept pur software, ele pot fi implementate folosind un sistem în timp real fără intervenția sistemului de operare sau a hardware-ului Vom reveni la modelele Linda și Ogs mai târziu în acest capitol Clasificarea sistemelor informatice paralele Se pot spune multe despre software-ul pentru sisteme informatice paralele, dar acum trebuie să revenim la subiectul principal al acestui capitol - arhitectura unor astfel de sisteme De-a lungul anilor au fost propuse și construite multe tipuri de sisteme de calcul paralele, așa că aș dori să le clasific cumva Mulți cercetători au încercat să facă acest lucru cu rezultate diferite [ , ], dar, din păcate, încă nu există o clasificare bună Clasificarea lui Flynn [ ] este folosită cel mai des, dar chiar și ea este destul de grosieră (Tabelul ) Capitolul Arhitecturi de calculatoare paralele Tabelul - - Clasificarea Flynn a sistemelor computerizate paralele Fluxuri de comandă Fluxuri de date Exemple de categorii SISD Mașină clasică von Neumann lot SIMD Vector supercalculator, procesor matrice Multe MISD Nu există Multe Multe MIMD Multiprocesor, multicomputer Clasificarea se bazează pe conceptele de fluxuri de comandă și fluxuri de date Fluxul de instrucțiuni corespunde contorului de instrucțiuni Un sistem cu n procesoare are n contoare de programe și, prin urmare, n fluxuri de instrucțiuni Fluxul de date este format dintr-un set de operanzi Fluxurile de comandă și de date sunt oarecum independente, deci există combinații de astfel de fluxuri (vezi Tabelul ) SISD (Single Instruction stream Single Data stream - un flux de instrucțiuni cu un flux de date) este arhitectura clasică a computerelor seriale von Neumann Un computer von Neumann are un flux de instrucțiuni și un flux de date și poate efectua o singură acțiune la un moment dat Mașinile aparținând categoriei SIMD (Single Instruction-stream Multiple Data-stream - one instruction stream with multiple data streams) au o unitate de control care emite câte o instrucțiune la un moment dat, dar există mai multe ALU-uri care pot procesa mai multe seturi de date la acelasi timp Prototipul mașinilor SIMD este procesorul ILLIAC IV (vezi Figura ) Deși aparatele SIMD nu sunt utilizate pe scară largă, unele computere convenționale folosesc instrucțiuni SIMD pentru a procesa date multimedia Instrucțiunile SSE din procesoarele Pentium sunt clasificate ca instrucțiuni SIMD În orice caz, există un domeniu în care ideile culese din "lumea SIMD" ies în prim-plan, și anume procesoarele de flux Procesoarele de flux sunt proiectate special pentru procesarea multimedia și pot juca un rol important în viitor [ ] MISD (Multiple Instruction-stream Single Data-stream - mai multe fluxuri de instrucțiuni cu un singur flux de date) este o categorie destul de ciudată Aici, mai multe comenzi operează pe același set de date Este dificil de spus dacă există astfel de mașini, deși unii cataloghează mașinile cu transportoare drept MISD Ultima categorie este MIMD (Multiple Instruction-stream Multiple Data-stream - fluxuri de instrucțiuni multiple cu fluxuri de date multiple) Aici, mai multe procesoare independente funcționează ca parte a unui sistem mai mare Majoritatea procesoarelor paralele se încadrează în această categorie Atât multiprocesoarele, cât și multicalculatoarele sunt mașini MIMD Am extins clasificarea lui Flynn (Figura ) Aparatele noastre SIMD sunt împărțite în două subgrupe Primul subgrup include numeroase supercalculatoare și alte mașini care funcționează pe vectori, efectuând aceeași operație pe fiecare element al vectorului Al doilea subgrup include mașini de tip ILLIAC IV, în care unitatea principală de control trimite comenzi către mai multe ALU independente Multiprocesoare Mesaje cu memorie partajată Orez Clasificarea calculatoarelor paralele În clasificarea noastră, categoria MIMD s-a împărțit în multiprocesoare (mașini cu memorie partajată) și multicalculatoare (mașini de mesagerie) Există trei tipuri de multiprocesoare Ele diferă unele de altele prin mecanismul de accesare a memoriei partajate și se numesc UMA (Uniform Memory Access - acces uniform la memorie), NUMA (NonUniform Memory Access - acces neuniform la memorie) și COMA (Cache Only Memory Access - acces numai la cache) memorie) Această subcategorizare are sens deoarece multiprocesoarele mari împart memoria în mai multe module În mașinile UMA, fiecare procesor are același timp de acces la orice modul de memorie Cu alte cuvinte, fiecare cuvânt poate fi citit din memorie în același ritm ca orice alt cuvânt Dacă acest lucru nu este posibil din punct de vedere tehnic, cele mai rapide accesări sunt încetinite pentru a se potrivi cu cele mai lente, astfel încât programatorul nu va observa nicio diferență Asta înseamnă acces "omogen" Această uniformitate face performanța previzibilă, iar acest factor este foarte important pentru crearea de programe eficiente O mașină NUMA, pe de altă parte, nu are proprietatea de uniformitate De obicei, fiecare procesor are unul dintre modulele de memorie care se află mai aproape de el decât celelalte, astfel încât accesul la acest modul de memorie este mult mai rapid decât altele În acest caz, din punct de vedere al performanței, unde ajung programul și datele este foarte important Accesul la aparatele SOMA se dovedește, de asemenea, a fi eterogen, dar dintr-un motiv diferit Ne vom uita la fiecare dintre opțiuni mai detaliat mai târziu, când vom studia subcategoriile corespunzătoare Capitolul Arhitecturi de calculatoare paralele A doua categorie principală de mașini MIMD este multicalculatoare, care, spre deosebire de multiprocesoare, nu partajează memoria la nivel arhitectural Cu alte cuvinte, sistemul de operare al unui procesor dintr-un multicomputer nu poate accesa memoria altui procesor prin simpla lansare a unei comenzi LOAD Procesorul va trebui să trimită un mesaj și să aștepte un răspuns Este capacitatea sistemului de operare de a citi un cuvânt dintr-un modul de memorie de la distanță folosind instrucțiunea LOAD care distinge multiprocesoarele de multicomputere După cum am observat deja, deși chiar și într-un multicomputer programele de utilizator pot accesa alte module de memorie folosind comenzile LOAD și STORE, această capacitate nu este suportată de hardware, sistemul de operare creează iluzia Diferența este minoră, dar foarte importantă Deoarece multicomputerele nu au acces direct la modulele de memorie la distanță, acestea sunt uneori clasificate ca NORMA (NO Remote Memory Access - fără acces la memorie la distanță) Multicalculatoarele pot fi, de asemenea, împărțite în două categorii suplimentare Categoria MPP (Massively Parallel Processor) include supercalculatoare scumpe care constau dintr-un număr mare de procesoare conectate printr-o rețea de comunicații internă de mare viteză Un exemplu comercial binecunoscut este supercalculatorul IBM SP/ A doua categorie de multicalculatoare include computerele personale convenționale sau stațiile de lucru (uneori montate în rafturi) care comunică în conformitate cu unele tehnologii de comunicații comerciale Din punct de vedere logic, nu există nicio diferență fundamentală aici, dar un supercomputer puternic în valoare de milioane de dolari este cu siguranță folosit diferit decât o rețea de calculatoare asamblată de utilizatorii finali, care este de multe ori mai ieftină decât orice mașină MPP Aceste sisteme "de origine" sunt uneori denumite rețele de stații de lucru (Network Of Work-stations, NOW), clustere de stații de lucru (Cluster Of Workstations, COW) sau pur și simplu clustere (cluster) Semantica memoriei Deși toate multiprocesoarele oferă procesoarelor o imagine a unui spațiu comun de adresă unică, adesea există multe module de memorie împreună cu acesta, fiecare dintre ele stochează o parte din memorie fizică Procesoarele și modulele de memorie sunt conectate printr-o rețea de comunicații complexă (vom vorbi despre aceasta în subsecțiunea "Rețele de comunicații" a secțiunii "Multicomputere") Mai multe procesoare pot încerca să citească un cuvânt din memorie în același timp în care alți procesoare încearcă să-l scrie; este posibil ca mesajele să nu fie livrate în ordinea în care au fost trimise La aceste probleme se adaugă existența mai multor copii ale unor fragmente de memorie (de exemplu, în memoria cache), și ca urmare vom ajunge în haos dacă nu luăm contramăsuri serioase În această subsecțiune, vom explora ce este cu adevărat memoria partajată și cum modulele de memorie pot fi utilizate cu înțelepciune în aceste circumstanțe Multiprocesoare Semantica memoriei poate fi privită ca un contract între software-ul de memorie și hardware [ ] Dacă software-ul este de acord să respecte anumite reguli, atunci memoria este de acord să producă anumite rezultate Principala problemă aici sunt regulile în sine, care se numesc modele de consistență Multe astfel de reguli au fost propuse și dezvoltate Pentru a vă face o idee despre problemă, să presupunem că procesorul scrie valoarea într-un cuvânt de memorie, iar puțin mai târziu procesorul scrie valoarea în același cuvânt Procesorul citește acest cuvânt și primește valoarea Ar trebui atunci proprietarul computerului să contacteze biroul de reparații? Depinde de ceea ce este promis în contract Solvabilitate strictă Cel mai simplu model este modelul de consistență strictă Într-un astfel de model, orice citire de la adresa x returnează întotdeauna valoarea celei mai recente intrări din x Programatorilor le place foarte mult acest model, dar poate fi pus în practică doar în felul următor: ar trebui să existe un singur modul de memorie care să servească pur și simplu toate cererile pe măsură ce intră (primul intrat, primul ieșit), stocarea în cache și duplicarea datelor nu sunt permis Din păcate, această abordare ar încetini semnificativ memoria, așa că cu greu poate fi considerată o propunere serioasă Consistență secvențială În continuare, luăm în considerare modelul de consistență secvențială [ ] Conform acestui model, atunci când există multiple cereri de citire și scriere, ordinea de procesare a cererii este determinată de hardware, dar toți procesoarele percep aceeași ordine Luați în considerare un exemplu Să presupunem că procesorul scrie valoarea în cuvântul x, iar după ns procesorul scrie acolo valoarea Acum să presupunem că la ns după începerea celei de-a doua operațiuni de scriere (procesul de scriere nu s-a încheiat încă), alte două procesoare, și , citiți cuvântul x de două ori (Fig ) Opțiunile posibile pentru secvența a șase evenimente sunt prezentate în tabel Înregistrare procesor Orez Două procesoare scriu, iar celelalte două procesoare citesc același cuvânt din memoria partajată Capitolul Arhitecturi de calculatoare paralele Tabelul Opțiuni posibile pentru succesiunea evenimentelor conform Fig Opțiunea Opțiunea Opțiunea Scrieți valoarea Scrieți valoarea Scrieți valoarea Scrieți valoarea Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesor Scrieți valoarea Scrieți valoarea Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul În primul caz, ambele procesoare primesc valoarea în fiecare dintre cele două operații de citire În a doua opțiune, procesorul primește valorile și , iar procesorul primește de ambele ori În a treia opțiune, procesorul primește de două ori , iar procesorul primește valorile și Toate aceste opțiuni sunt valabile, precum și altele, care nu sunt afișate aici Memoria construită după modelul de consistență secvențială nu ar permite niciodată procesorului să obțină valorile și dacă procesorul ar primi valorile și Dacă acest lucru s-ar întâmpla, din punctul de vedere al procesorului , aceasta ar însemna că procesorul a scris valoarea finalizată înainte ca procesorul să scrie valoarea Acest lucru este complet posibil Dar din punctul de vedere al procesorului , aceasta înseamnă și că scrierea procesorului de s-a încheiat înainte de scrierea procesorului de Prin el însuși, acest rezultat este posibil, dar contrazice primul rezultat Consistența secvențială garantează o singură secvență globală (percepută de toate procesoarele) de operații de scriere Daca din punctul de vedere al procesorului se scrie prima valoarea , procesorul ar trebui sa "vada" la fel Deși regulile de consistență secvențială nu arată la fel de "crude" precum regulile de consistență strictă, acest model este și el foarte util Chiar dacă mai multe evenimente au loc în același timp, se consideră că ele se întâmplă de fapt într-o anumită ordine (care poate fi aleasă arbitrar), iar toți procesatorii percep această ordine Deși această stare de fapt pare evidentă, în cele ce urmează vom avea în vedere câteva modele de consistență care nu garantează o astfel de comandă Viabilitatea procesorului Consistența procesorului nu este un model foarte strict, dar este mai ușor de implementat pe multiprocesoare mari [ ] Are două proprietăți: Toate procesoarele văd operațiile de scriere ale oricărui procesor în ordinea în care sunt efectuate aceste operațiuni Toate procesoarele văd toate scrierile pe orice cuvânt de memorie în aceeași ordine Multiprocesoare Ambele puncte sunt foarte importante Primul paragraf spune că dacă procesorul începe să scrie valorile IA, ІВиІСв în orice loc din memorie în această ordine, atunci toate celelalte procesoare vor vedea aceste înregistrări în aceeași ordine Cu alte cuvinte, nu se va întâmpla niciodată ca vreun procesor să vadă mai întâi valoarea B și apoi valoarea IA Al doilea punct este să vă asigurați că fiecare cuvânt din memorie are o semnificație definită și neechivocă după ce procesorul a făcut mai multe scrieri pe acel cuvânt și apoi s-a oprit Toată lumea ar trebui să vadă aceeași ultima valoare Chiar și cu astfel de limitări, dezvoltatorul are o mulțime de opțiuni Să vedem ce se întâmplă dacă procesorul începe trei scrieri ale A, B și C simultan cu trei scrieri ale procesorului Alte procesoare care sunt ocupate să citească cuvinte din memorie vor vedea o secvență de șase scrieri, de exemplu, IA, B, A , B, IC, C sau A, IA, B, C, B, C; etc Cu consistența procesorului, nu este garantat că fiecare procesor vede aceeași ordine (spre deosebire de consistența secvențială) Este posibil ca unii procesoare să perceapă ordinea IA, B, A, B, IC, C, alții - A, IA, B, C, B, C și încă alții - o altă opțiune Singurul lucru care este absolut garantat este că niciun procesor nu va vedea secvența în care operația B este efectuată mai întâi și apoi IA Ordinea în care sunt executate accesările la același procesor rămâne aceeași pentru toți observatorii Solvabilitate slabă În modelul de consistență slabă, nu este garantat că operațiunile de scriere efectuate de un procesor vor fi percepute de alții în aceeași ordine [ ] Un procesor poate vedea mai întâi operațiunea IA, apoi B, celălalt - mai întâi B, apoi IA Pentru a aduce ordine în acest haos, trebuie să existe variabile de sincronizare a memoriei sau o operație de sincronizare a memoriei suportată La sincronizare, toate operațiunile de scriere în așteptare sunt finalizate și nicio operațiune nouă nu poate începe până când toate scrierile anterioare nu s-au încheiat și sincronizarea în sine s-a încheiat Sincronizarea aduce memoria într-o stare stabilă în care nu există operațiuni în așteptare Operațiile de sincronizare în sine sunt consistente secvenţial, adică dacă sunt inițiate de mai mulți procesoare, se alege o anumită ordine pentru a le executa, iar toți procesoarele percep aceeași ordine Cu o consistență slabă, timpul este împărțit în perioade strict consecutive separate prin operații de sincronizare (Fig ) Nu este garantată o comandă specială pentru operațiunile de scriere IA și B, iar diferitele procesoare le pot percepe diferit, adică din punctul de vedere al unui procesor, operația IA poate fi efectuată mai întâi, apoi B și din punct de vedere a altuia, mai întâi B, apoi IA Această situație este acceptabilă Cu toate acestea, pentru toate procesoarele, operațiunea B a fost finalizată înainte de C, deoarece înregistrările C, B, A, B au putut începe numai după ce înregistrările IA, B și A au fost finalizate în timpul primei operațiuni de sincronizare Astfel, folosind operațiuni de sincronizare, este posibil să se introducă în mod programatic o anumită ordine în succesiunea evenimentelor, deși acest lucru durează ceva timp, deoarece necesită curățarea conductei de memorie Capitolul Arhitecturi de calculatoare paralele Înregistrare A B C A B Procesorul A Procesorul B Procesorul C PENTRU ST Momentul de sincronizare D E C AP F D Timp Orez Operațiile de sincronizare sunt efectuate periodic pe o memorie slab consistentă Solvabilitate liberă Consistența slabă nu este un model foarte eficient, deoarece necesită finalizarea tuturor operațiunilor de memorie și întârzie noile operațiuni până la finalizarea celor anterioare În modelul de consistență gratuită, lucrurile stau mult mai bine, deoarece folosește ceva similar cu secțiunile critice ale programului Ideea este următoarea Dacă un proces iese în afara regiunii critice, aceasta nu înseamnă că toate scrierile ar trebui să se termine imediat Este necesar doar ca toate scrierile să fie finalizate înainte ca orice proces să intre din nou în această regiune critică În acest model, operația de sincronizare este separată în două operații diferite Pentru a citi sau a scrie într-o variabilă partajată, procesorul (adică, software-ul său) trebuie mai întâi să efectueze o operație de achiziție asupra variabilei de sincronizare, ceea ce îi permite să obțină acces exclusiv la datele partajate Procesorul poate apoi să facă orice dorește să facă cu datele (citește sau scrie), iar când este gata, trebuie să emită o operație de eliberare a variabilei de sincronizare pentru a indica faptul că s-a terminat Operația de eliberare nu necesită finalizarea scrierilor în așteptare, dar nu se poate finaliza singură până când toate scrierile începute anterior nu se vor finaliza Mai mult, operațiunile noi de memorie pot începe imediat Când începe următoarea operațiune de achiziție, se face o verificare pentru a vedea dacă toate operațiunile de eliberare anterioare s-au încheiat Dacă nu, atunci operația de achiziție este întârziată până când este finalizată (și toate operațiunile de scriere trebuie finalizate înainte ca toate operațiunile de eliberare să se fi încheiat) Astfel, dacă următoarea achiziție are loc suficient de mult după ultima lansare, nu trebuie să aștepte și poate intra în regiunea critică fără întârziere Dacă o operațiune de achiziție este executată la scurt timp după o operație de eliberare, aceasta (și orice comenzi care trebuie să urmeze) așteaptă ca toate operațiunile de eliberare să se termine Acest lucru asigură că toate variabilele sunt critice Multiprocesoare lusti va fi actualizat Acest model este ceva mai complex decât modelul de consecvență slabă, dar are un avantaj semnificativ: nu trebuie să întârzie execuția comenzilor la fel de des ca în modelul de consecvență slabă Problema viabilității memoriei nu poate fi considerată definitiv rezolvată Cercetătorii încă mai propun noi modele [ , ] Multiprocesoare IMA în arhitecturi multiprocesoare simetrice Cele mai simple multiprocesoare au o singură magistrală (Fig , a) Două sau mai multe procesoare și unul sau mai multe module de memorie folosesc această magistrală pentru a comunica Dacă procesorul trebuie să citească un cuvânt din memorie, mai întâi verifică dacă magistrala este liberă Dacă magistrala este liberă, procesorul plasează pe magistrală adresa cuvântului dorit, afirmă câteva semnale de control și așteaptă ca memoria să plaseze cuvântul solicitat pe magistrală Memoria comună Obosi a b V Orez Trei variante de multiprocesor pe o singură magistrală: fără cache (a); cu cache ( ); cu memorie cache și module separate de memorie locală (c) Dacă magistrala este ocupată, procesorul așteaptă pur și simplu ca acesta să devină liber Există o problemă cu această schemă Cu două sau trei procesoare, accesul la magistrală nu este greu de reglat, dificultăți apar atunci când există procesoare sau Performanța sistemului în acest caz este complet determinată de lățimea de bandă a magistralei și multe procesoare trebuie să rămână inactiv de cele mai multe ori Pentru a rezolva problema, trebuie să adăugați memorie cache la fiecare procesor, așa cum se arată în Fig b Memoria cache poate fi amplasată în interiorul cipului procesorului, lângă cipul procesorului, pe placa procesorului Capitolul Arhitecturi de calculatoare paralele Orice combinație a acestor opțiuni este permisă Deoarece în acest caz se pot citi multe cuvinte din cache, traficul pe autobuz va scădea, iar sistemul va putea deservi mai multe procesoare Astfel, memorarea în cache are un efect semnificativ în acest caz În schema următoare, fiecare procesor are nu doar un cache, ci și propria sa memorie locală, pe care o accesează printr-o magistrală locală dedicată (Fig , c) Pentru a face o utilizare optimă a acestei configurații, compilatorul trebuie să plaseze tot codul programului, șirurile de caractere, constantele și alte date de numai citire, precum și stivele și variabilele locale, în unitățile de memorie locale Memoria partajată va fi necesară doar pentru stocarea variabilelor partajate În majoritatea cazurilor, o astfel de distribuție rezonabilă reduce semnificativ volumul de trafic pe autobuz și nu necesită asistență activă din partea compilatorului Consistența în cache Să presupunem că memoria este consecvențială Ce se întâmplă atunci când procesorul are o linie în memoria cache, iar procesorul încearcă să citească un cuvânt corespunzător aceleiași linii de cache? În absența unor reguli speciale, procesorul va primi o copie a acestei linii în memoria cache În principiu, memorarea în cache dublă a aceluiași șir este perfect acceptabilă Acum să presupunem că procesorul modifică un rând și imediat după aceea procesorul citește o copie a acelui rând din memoria cache Ca rezultat, primește date învechite, rupând contractul dintre software și memorie Acest lucru nu va duce la nimic bun pentru programul executat de procesorul Această problemă, care se numește problema consistenței cache-ului, este foarte importantă Dacă nu este activată, memoria cache nu poate fi utilizată, iar numărul de multiprocesoare conectate la o magistrală va trebui redus la două sau trei Multe soluții diferite au fost propuse de experți (vezi, de exemplu, [ , ]) Deși toți acești algoritmi, numiți protocoale de potrivire a memoriei cache, diferă în unele detalii, toți împiedică să apară versiuni diferite ale aceleiași linii în două sau mai multe cache în același timp În toate soluțiile, controlerul cache este proiectat astfel încât cache-ul să poată monitoriza cererile care vin prin magistrală de la alte procesoare și alte cache, luând anumite acțiuni de la caz la caz Acest dispozitiv se numește snooping cache, deoarece cache-ul, așa cum spune, "monitorizează" magistrala Setul de reguli urmate de cache, procesoare și memoria principală pentru a preveni apariția diferitelor versiuni de date în mai multe cache se numește protocol de consistență a cache-ului Unitatea de transmisie și stocare pentru un cache este o linie cache De obicei, o linie de cache are sau de octeți Cel mai simplu protocol pentru coordonarea cache-urilor se numește write through Pentru a înțelege mai bine cum funcționează acest protocol, luați în considerare cele cazuri enumerate în Tabelul Dacă procesorul încearcă să citească Multiprocesoare un cuvânt care nu este în cache, controlerul cache încarcă linia care conține acel cuvânt în cache Șirul este furnizat de memoria principală, care în acest protocol trebuie să stocheze întotdeauna date actualizate În viitor, informațiile pot fi citite din cache Tabelul Scriere (colonele goale înseamnă că nu are loc nicio acțiune) Acțiune Solicitare locală Solicitare la distanță Read cache miss Preluarea datelor din memorie Afișarea pentru citirea cache-ului Folosind datele cache-ului local Write cache miss Actualizați datele din memorie Atingeți cache de intrare Actualizați memoria cache și memoria Invalidați intrarea în cache În cazul unei pierderi de scriere cache, cuvântul modificat este scris în memoria principală Șirul care conține cuvântul dorit nu este încărcat în cache În cazul unei lovituri de cache de scriere, memoria cache este actualizată și cuvântul este, de asemenea, scris în memoria principală Esența protocolului este că, ca rezultat al tuturor operațiunilor de scriere, cuvântul care este scris trece în mod necesar prin memoria principală, astfel încât datele din memoria principală să fie întotdeauna "proaspete" Să ne uităm din nou la toate aceste acțiuni, dar acum din perspectiva unui cache de urmărire (coloana din dreapta tabelului ) Să numim cache-ul care efectuează acțiunea Cache și cache slave Cache Dacă are loc o pierdere de citire a cache-ului Cache , Cache merge la magistrală pentru a obține linia corectă din memoria principală Cache vede asta, dar nu face nimic Dacă apare o lovitură în cache de citire Cache (adică linia dorită este deja în Cache ), magistrala nu este accesată, astfel încât Cache nu știe nimic despre accesările cache de citire Cache Procesul de înregistrare este mai interesant Dacă procesorul scrie un cuvânt, memoria cache accesează magistrala atât pentru o pierdere de cache, cât și pentru o lovitură de cache Pentru orice scriere, memorați în cache verificări pentru prezența cuvântului care este scris Dacă cuvântul lipsește, memoria cache îl tratează ca o pierdere a memoriei cache la distanță și nu face nimic (Rețineți că, conform Tabelului , o pierdere a memoriei cache de la distanță înseamnă că cuvântul nu se află în memoria cache de urmărire și dacă este sau nu în memoria cache a inițiatorului nu contează Astfel, aceeași solicitare poate returna un cache local - loviți și ratați pentru memoria cache de urmărire și invers ) Acum să presupunem că Cache scrie un cuvânt care se află în Cache Dacă Cache nu face nimic, va conține date învechite, astfel încât Cache invalidează intrarea în cache care conține cuvântul modificat Ca rezultat, elementul este pur și simplu eliminat din cache Deoarece toate cache-urile țin evidența tuturor acceselor la magistrală, scrierea oricărui cuvânt îl va actualiza în memoria cache a inițiatorului și în memoria principală și îl va elimina din toate celelalte cache Acest lucru previne apariția versiunilor inconsistente Capitolul Arhitecturi de calculatoare paralele Desigur, procesorul cache este liber să citească același cuvânt în următorul ciclu În acest caz, memoria cache primește cuvântul din memoria principală, care a fost deja actualizată În acest moment, memoria cache , memoria cache și memoria principală conțin copii identice ale cuvântului respectiv Dacă scrie vreun procesor, atunci cache-urile altor procesoare vor fi șterse, iar memoria principală va fi actualizată din nou Sunt posibile diferite variante ale acestui protocol de bază De exemplu, în cazul unei lovituri de cache de scriere, cache-ul servo invalidează de obicei elementul care conține cuvântul care este scris Cu toate acestea, în loc să invalidați cuvântul, puteți accepta noua valoare și puteți actualiza memoria cache În esență, reîmprospătarea memoriei cache este același lucru cu invalidarea unui element și apoi citirea cuvântului corect din memorie În toate protocoalele de stocare în cache, trebuie făcută o alegere între o strategie de actualizare și o strategie de invalidare Aceste protocoale funcționează diferit sub sarcini diferite Mesajele de reîmprospătare au o sarcină utilă și, prin urmare, sunt mai mari decât mesajele de date nevalide, dar pot preveni pierderile ulterioare ale memoriei cache O altă opțiune este să încărcați memoria cache a martorilor la erorile din memoria cache de scriere O astfel de încărcare nu afectează în niciun fel corectitudinea algoritmului; afectează doar performanța Se pune întrebarea: care este probabilitatea ca cuvântul tocmai scris să fie scris din nou în curând? Atunci când probabilitatea este mare, se poate vorbi în favoarea încărcării cache-ului pe pierderile de cache de scriere (politica de completare cu scriere) Când probabilitatea este scăzută, este mai bine să nu reîmprospătați memoria cache în cazul pierderii cache-ului de scriere Dacă cuvântul este pe cale să fie citit în curând, acesta va fi încă încărcat după o pierdere de citire a memoriei cache, deci nu are rost să-l încărcați într-o pierdere a memoriei cache de scriere La fel ca majoritatea soluțiilor simple, această soluție nu este foarte eficientă Fiecare operațiune de scriere necesită transferarea datelor în memoria principală prin magistrală, iar cu un număr mare de procesoare, magistrala devine un blocaj Prin urmare, au fost dezvoltate alte protocoale Toate au un lucru în comun: nu orice operație de scriere are ca rezultat o scriere directă în memoria principală În schimb, atunci când o linie de cache se modifică, un bit special este setat în interiorul cache-ului pentru a indica faptul că linia din cache este validă, dar nu este în memorie Deși șirul va trebui în cele din urmă scris în memorie, este probabil ca acest lucru să se întâmple după câteva operații de scriere Acest tip de protocol se numește protocol de scriere înapoi Protocolul MESI Un protocol de rescriere popular este protocolul MESI (Invalid, Shared, Exclusive, Modified), denumit după primele litere ale celor patru stări posibile ale elementelor cache [ ] Se bazează pe protocolul anterior scris o dată [ ] Protocolul MESI este folosit de Pentium și de alte procesoare pentru a monitoriza magistrala Conform acestui protocol, fiecare element cache poate fi în una dintre următoarele patru stări: Multiprocesoare + invalid - elementul din cache conține date nevalide; + shared - elementul poate fi stocat în mai multe cache, memoria este actualizată; + exclusiv - elementul este doar în acest cache (nu se află în niciun alt cache), memoria este actualizată; + modificat - elementul este valid, memoria principală este invalidă, nu există copii ale elementului Când procesorul este încărcat, toate intrările din cache sunt marcate ca nevalide În timpul primei citiri din memoria principală, linia dorită este chemată în memoria cache a acestui procesor și marcată ca exclusivă, deoarece aceasta este singura copie în cache (Fig , a) La citirile ulterioare, procesorul folosește această linie fără a accesa magistrala Un alt procesor poate apela aceeași linie și o poate pune în cache În acest caz, primul rowholder (procesorul ) învață prin snooping că nu mai este singurul rowholder și anunță prin autobuz că are o copie Ambele copii sunt marcate ca partajate (Figura b) Cu alte cuvinte, starea "partajată" înseamnă că memoria este actualizată, iar linia după citire se află într-unul sau mai multe cache-uri La citirile ulterioare ale șirului partajat, procesorul nu folosește magistrala și nu schimbă starea șirului Să vedem acum ce se întâmplă când procesorul scrie pe o linie cache partajată În acest caz, procesorul plasează un semnal special pe magistrală, informând toate celelalte procesoare că copiile lor nu mai sunt valabile, în timp ce copia din memoria cache a procesorului însuși intră în starea "modificată" (Fig , c) Acest șir nu este scris în memorie Rețineți că, dacă rândul specificat este exclusiv, nu trebuie trimis niciun semnal invalid către magistrală, deoarece nu există alte copii ale rândului Apoi, aflați ce se întâmplă când procesorul citește această linie Procesorul , care este în prezent deținătorul liniei, știe că copia din memorie este invalidă, așa că trimite un semnal către magistrală pentru a spune procesorului să aștepte în timp ce aceasta scrie linia înapoi în memorie Imediat după scriere, procesorul apelează din memorie o copie a liniei tocmai scrise, iar în ambele cache linia este marcată ca partajată (Fig , d) Atunci când procesorul scrie din nou acea linie (Figura c), copia sa în memoria cache a procesorului devine invalidă În cele din urmă, lăsați acum Procesorul să scrie cuvântul pe linie Procesorul vede că se încearcă o scriere și pune un semnal pe magistrală care îi spune Procesorului să aștepte în timp ce Procesorul își scrie linia în memorie După ce scrierea este terminată, procesorul marchează propria copie a șirului ca nevalidă, deoarece știe că un alt procesor este pe cale să o schimbe Apare o situație în care procesorul scrie pe o linie necache Dacă se aplică politica de completare prin scriere, rândul va fi încărcat în cache și marcat ca modificat (Figura e) Dacă nu este aplicată nicio politică de completare cu scriere, scrierea are loc direct în memorie și șirul nu este memorat în cache nicăieri Capitolul Arhitecturi de calculatoare paralele Cache Bus Procesorul citește blocul A A Procesorul citește blocul A b Obosi Obosi Procesorul scrie blocul A Obosi Procesorul citește blocul A Obosi Procesorul scrie blocul A Obosi Procesorul scrie blocul A Orez Ilustrație a protocolului MESI Multiprocesoare UMA interconectate Datorită prezenței unui singur bus într-un multiprocesor UMA, chiar și după optimizare, nu pot exista mai mult de sau de procesoare Pentru a crește numărul de procesoare, este necesar un alt tip de rețea de comunicații Cea mai simplă schemă de conectare a n procesoare cu k blocuri de memorie este comutarea încrucișată Multiprocesoare (Fig ) Conexiunea încrucișată a fost folosită de multe decenii în comutatoarele telefonice, care permit conectarea unor grupuri de linii de intrare și de ieșire într-un mod arbitrar comutare comutare nod nod Orez Comutare încrucișată x (a); nodul deschis (b); nod închis (in) La fiecare intersecție a liniilor orizontale (de intrare) și verticale (de ieșire) există un nod de comutare (punct de încrucișare), care poate fi deschis sau închis în funcție de dacă liniile orizontale și verticale trebuie conectate sau nu Pe fig , și vedem că trei noduri sunt închise, datorită cărora se stabilește simultan comunicarea între următoarele perechi procesor-memorie ( , ), ( , ) și ( , ) Sunt posibile și alte combinații Numărul de combinații este egal cu numărul de opțiuni pentru plasarea a opt turnuri pe o tablă de șah, astfel încât niciuna dintre ele să nu fie atacată de alta Una dintre cele mai frumoase proprietăți ale unei rețele cu comutare încrucișată este că nu este blocată Aceasta înseamnă că procesorul se va putea conecta întotdeauna la modulul de memorie potrivit, chiar dacă unele linii sau noduri sunt deja ocupate (presupunând că modulul de memorie în sine este disponibil) În plus, nu este necesară o planificare prealabilă Chiar dacă au fost deja stabilite șapte conexiuni arbitrare, este întotdeauna posibil să conectați procesorul rămas la modulul de memorie rămas În continuare, vom lua în considerare schemele de interconectare care nu au această capacitate Una dintre cele mai rele proprietăți ale comutării încrucișate este că numărul de noduri crește cu n Pentru sisteme de dimensiuni medii, interconectare Capitolul Arhitecturi de calculatoare paralele este o soluție bună și ne vom uita la o astfel de soluție mai târziu în acest capitol, multiprocesorul Sun Fire E K NUMA Cu toate acestea, de procesoare și de module de memorie ar necesita un milion de noduri, ceea ce este inacceptabil Este nevoie de ceva complet diferit iMA-multiprocesoare cu comutare în mai multe etape În centrul acestui "complet diferit" se află un mic comutator x (Fig , a) cu două intrări și două ieșiri Mesajele care sosesc pe oricare dintre liniile de intrare pot fi comutate pe orice linie de ieșire În exemplul nostru, mesajele vor conține până la patru părți (Figura b) Câmpul pentru modul indică ce modul de memorie este solicitat Câmpul de adresă definește adresa din acest modul de memorie Câmpul de cod operație specifică una dintre operațiunile disponibile, cum ar fi READ sau WRITE În cele din urmă, câmpul opțional de valoare poate conține un operand, cum ar fi un cuvânt de de biți, care urmează să fie scris atunci când se efectuează o operație WRITE Comutatorul verifică câmpul modulului și îl folosește pentru a determina dacă mesajul trebuie trimis prin X sau Y - X A - IN - A Modul Abordare Cod operațiune Sensul b Orez Comutator x (a); formatul mesajului (b) Switch-urile noastre x pot fi configurate în diferite moduri pentru a realiza rețele comutate în mai multe etape O opțiune este rețeaua omega (Figura ) Aici, procesoare sunt conectate la module de memorie prin comutatoare Pentru n procesoare și n module de memorie, avem nevoie de log n etape și n/ comutatoare pe etapă, adică (n/ )log n comutatoare în total, ceea ce este mult mai mic decât n noduri de comutare în comutare încrucișată, în special pentru valori mari din n Schema de conexiuni a rețelei omega este adesea menționată ca o amestecare perfectă, deoarece amestecarea semnalelor în fiecare etapă este ca amestecarea unui pachet de cărți Pentru a înțelege cum funcționează rețeaua omega, să presupunem că procesorul trebuie să citească un cuvânt din modulul de memorie Procesorul trimite un mesaj READ pentru comutatorul D, care conține în câmpul modulului Comutatorul ia primul (adică cel din stânga) bit de la și învață direcția de la acesta ( indică ieșirea de sus, indică partea de jos) Deoarece acest bit este în acest caz, mesajul este trimis prin ieșirea inferioară către comutatorul D Toate comutatoarele din a doua etapă, inclusiv D, folosesc al doilea bit pentru a determina direcția În acest caz, este , deci mesajul este trimis prin ieșirea de jos către comutatorul D, care verifică al treilea bit Este , așa că mesajul trece prin ieșirea de sus și sosește Multiprocesoare intră în modulul de memorie , ceea ce ne-am dorit Calea parcursă de mesaj este prezentată în Fig litera a Procesoare pași Module de memorie Orez rețea de comutație în mai multe etape omega Pe măsură ce mesajul călătorește prin rețea, acesta nu mai are nevoie de toți biții numărului de modul, începând de la cel din stânga, unul câte unul Acestea pot fi folosite pentru a înregistra numerele de linii de intrare, astfel încât să se știe la ce cale să se trimită răspunsul Pentru calea a, liniile de intrare sunt (intrarea superioară în D), (intrarea inferioară în D) și respectiv (intrarea inferioară în D) Astfel, la trimiterea unui răspuns se folosește și secvența , citită doar de la dreapta la stânga Să presupunem că, în timp ce toate acestea se întâmplă, procesorul decide de asemenea să scrie un cuvânt în modulul de memorie Un proces similar are loc aici Mesajul este trimis prin ieșirile de sus, de sus și de jos, respectiv Pe fig această cale este marcată cu litera b Când un mesaj ajunge la destinație, câmpul său de modul conține secvența , indicând calea pe care a parcurs mesajul Deoarece aceste două solicitări trec prin comutatoare, benzi și module de memorie diferite, ele pot rula în paralel Acum să vedem ce s-ar întâmpla dacă procesorul ar trebui să acceseze modulul de memorie Solicitarea sa ar intra în conflict cu cea a procesorului de pe comutatorul A, iar unul dintre ei ar trebui să aștepte Adică, spre deosebire de rețeaua cu comutare încrucișată, rețeaua omega este o rețea de blocare Nu toate seturile de solicitări pot fi trimise în același timp Coliziunile pot apărea atât între solicitări (când se utilizează aceeași linie sau același comutator), cât și între solicitări (în memorie) și răspunsuri (din memorie) Este destul de evident că este de dorit să se distribuie uniform accesurile la memorie între modulele de memorie O modalitate posibilă este să folosiți biții mai puțin semnificativi ca număr de modul Luați în considerare un spațiu de adrese adresat de octeți pentru un computer care are nevoie în principal de acces la cuvinte de de biți Cei doi biți cei mai puțin semnificativi sunt de obicei , dar următorii trei Capitolul Arhitecturi de calculatoare paralele biții sunt distribuiti uniform Dacă folosiți acești trei biți ca număr de modul de memorie, cuvintele adresate secvenţial ajung în module consecutive Un sistem de memorie în care cuvintele succesive rezidă în module de memorie diferite se numește stratificat Memoria stratificată aduce paralelism la absolut, deoarece majoritatea acceselor de memorie sunt accesări la adrese secvențiale De asemenea, este posibilă dezvoltarea rețelelor neblocante, în care sunt oferite mai multe căi de la fiecare procesor la fiecare modul de memorie pentru optimizarea traficului Procesoare multiple NUMA Numărul de procesoare din multiprocesoarele UMA cu o singură magistrală este de obicei limitat la câteva zeci, iar multiprocesoarele cu comutare încrucișată sau cu mai multe etape necesită hardware scump și nu au mult mai multe procesoare Pentru a combina mai mult de de procesoare într-un singur multiprocesor, este nevoie de altă soluție Anterior, se presupunea că toate modulele de memorie au același timp de acces Dacă nu vă concentrați pe acest concept, puteți ajunge la multiprocesoare cu acces neuniform la memorie (NonUniform Memory Access, NUMA) La fel ca multiprocesoarele UMA, acestea oferă un singur spațiu de adresă pentru toate procesoarele, dar spre deosebire de mașinile UMA, accesul la modulele de memorie locală este mai rapid decât la cele la distanță Prin urmare, toate programele UMA vor putea rula neschimbate pe o mașină NUMA, dar performanța va fi mai slabă decât pe o mașină UMA cu aceeași viteză de ceas Aparatele NUMA au trei caracteristici cheie care, împreună, le deosebesc de alte multiprocesoare: + există un singur spațiu de adresă vizibil tuturor procesoarelor; + accesul la memoria de la distanță se face prin comenzile LOAD și STORE; + Accesul la memoria de la distanță este mai lent decât accesul la memoria locală Dacă timpul de acces la memoria la distanță nu este mascat de cache (nu există cache), un astfel de sistem se numește NC-NUMA (No Caching NUMA - NUMA without caching) Dacă sunt prezente cache-uri coerente, atunci sistemul se numește CC-NUMA (Coherent Cache NUMA - NUMA with coerent caches) Programatorii se referă adesea la acest sistem ca memorie partajată distribuită hardware, deoarece este în esență aceeași cu memoria partajată distribuită (DSM) implementată în software, dar suportată în hardware folosind dimensiuni mici ale paginilor Una dintre primele mașini NC-NUMA a fost multiprocesorul Carnegie-Mellon Cm Este prezentat într-un mod simplificat în Fig , [ ] Acest multiprocesor a constat dintr-un set de procesoare LSI- , fiecare cu propria memorie accesată prin magistrala locală (LSI- este o versiune cu un singur procesor a foarte popularului minicomputer DEC PDP- din anii ' ) În plus, procesoarele LSI- erau conectate între ele printr-o magistrală de sistem Când s-a efectuat un acces la memorie, cererea a fost trimisă la administratorul de memorie, Multiprocesoare care a verificat dacă cuvântul dorit se află sau nu în memoria locală Dacă da, cererea a fost trimisă prin magistrala locală; dacă nu, cererea a fost trimisă prin magistrala de sistem către sistemul care conținea cuvântul Desigur, a doua operație a necesitat mult mai mult timp decât prima Executarea unui program stocat în memoria de la distanță a durat de ori mai mult decât executarea aceluiași program localizat local Memoria procesorului Memorie procesorului Memoria procesorului Memoria procesorului Autobuz de sistem Orez Mașină NUMA cu două nivele de magistrală Consistența memoriei într-o mașină NC-NUMA este garantată deoarece nu are cache Fiecare cuvânt de memorie poate fi doar într-un singur loc, așa că nu există pericolul de a avea o copie cu date învechite - nu există copii deloc În ce modul de memorie se află o anumită pagină este de mare importanță, deoarece performanța depinde de aceasta Pentru a maximiza performanța în mașinile NC-NUMA, a fost implementată următoarea schemă complexă de suport software pentru mișcarea paginii De obicei, la fiecare câteva secunde, ar rula un proces special de "câine de pază" (daemon) numit scanner de pagini Sarcina sa este de a monitoriza statisticile de utilizare a paginii și de a le muta în așa fel încât performanța să crească Dacă pagina a ajuns în locul "greșit", scannerul de pagini a descărcat-o din memorie, astfel încât următorul acces la ea a provocat o eroare de ieşire a paginii Când apare o eroare a paginii, se ia o decizie cu privire la locul în care se pune pagina (poate nu în modulul de memorie în care se afla anterior) Pentru a preveni alunecarea, a existat o regulă conform căreia pagina, după plasare, ar trebui să rămână pe loc pentru timpul AT Au fost propuși mulți alți algoritmi, dar niciunul dintre ei nu a devenit de departe cel mai bun [ ] multiprocesoare CC-NUMA Multiprocesoare precum cel prezentat în Fig nu se scalează bine pentru că nu au cache Accesarea memoriei de la distanță de fiecare dată pentru a accesa un cuvânt care nu se află în memoria locală este foarte risipitoare și are un impact foarte negativ asupra performanței Cu toate acestea, odată cu adăugarea memoriei cache, există o problemă de consistență a memoriei cache O modalitate de a menține cache-urile consistente este să urmăriți magistrala de sistem Din punct de vedere tehnic, acest lucru nu este greu de realizat, dar atunci când numărul de procesoare depășește o anumită limită, similar cu Capitolul Arhitecturi de calculatoare paralele solutia devine irealizabila Multiprocesoarele cu adevărat mari necesită o abordare complet diferită Cea mai populară abordare de astăzi pentru construirea de multiprocesoare mari legate de sistemele CC-NUMA este implementată în multiprocesorul bazat pe directoare Ideea de bază este de a păstra o bază de date cu informații despre exact unde se află fiecare linie de cache și care este starea acesteia La accesarea unei linii de cache, o interogare este trimisă în baza de date despre locul în care se află această linie și dacă este "curată" sau "murdară" (modificată) Deoarece baza de date trebuie să fie solicitată pentru orice instrucțiune de acces la memorie, baza de date trebuie să fie susținută de hardware dedicat de mare viteză, capabil să proceseze cererea în fracțiuni de ciclu de magistrală Pentru a înțelege mai bine ce este un multiprocesor bazat pe directoare, luați în considerare ca exemplu un sistem cu de noduri în care fiecare nod este format dintr-un singur procesor și MB de RAM conectat la procesor printr-o magistrală locală Cantitatea totală de memorie este de de octeți Este împărțit în de linii cache a câte de octeți fiecare Memoria este distribuită static între noduri: adresele - M sunt situate în nodul , adresele - M sunt situate în nodul etc Nodurile sunt conectate printr-o rețea de comunicații (Fig , a) Rețeaua poate fi implementată ca o rețea, hipercub sau altă topologie Fiecare nod conține intrări de director pentru linii cache de de octeți, alcătuind de octeți de memorie Pentru moment, presupunem că o linie poate fi conținută în cel mult un cache Nodul Nodul Nodul Memoria procesorului Memoria procesorului Memoria procesorului Biți Nod bloc Părtinire - treizeci V b Orez Multiprocesor bazat pe director, care conține de noduri (a); împărțirea unei adrese de memorie pe de biți în câmpuri (b); director la nodul (in) Multiprocesoare Pentru a înțelege cum funcționează un director, să urmăm calea comenzii LOAD de la procesorul , care accesează un rând din cache În primul rând, procesorul care a emis comanda o transmite managerului de memorie, care o traduce pentru a obține o adresă fizică, cum ar fi x Managerul de memorie împarte această adresă în trei părți, așa cum se arată în Fig b În notație zecimală, aceste trei părți sunt nodul , rândul și offset-ul Managerul de memorie vede că cuvântul de memorie care este accesat este la nodul , nu la nodul , așa că trimite o cerere prin rețea la nodul , unde se află linia dorită, află dacă linia este în cache și, dacă da, unde exact Când o solicitare ajunge la nodul , aceasta este direcționată către dispozitivul director Dispozitivul verifică un tabel cu intrări (o intrare pe linie de cache) și preia intrarea În fig În Figura - , puteți vedea că linia nu este în cache, astfel încât dispozitivul preia linia din memoria RAM locală, o trimite la nodul și actualizează intrarea din director pentru a arăta că linia se află în memoria cache a nodului Acum să ne uităm la o a doua interogare, de data aceasta pentru rândul de la nodul În fig În Figura , puteți vedea că această linie se află în memoria cache a nodului În acest moment, dispozitivul poate actualiza intrarea din director pentru a indica că linia se află acum în nodul , apoi trimite un mesaj la nodul , astfel încât linia de la este transmis la nodul și invalidează memoria cache a nodului Rețineți că mai multe mesaje trebuie transmise în orice multiprocesor cu memorie partajată Să calculăm câtă memorie ocupă directoarele Fiecare nod conține MB de RAM și oligoelemente de biți pentru RAM respectivă Astfel, directorul ia aproximativ x biți de la MB, sau aproximativ , %, ceea ce este destul de acceptabil Chiar dacă linia cache are de octeți, pierderea memoriei este de doar % Dacă lungimea liniei de cache este de de octeți, pierderea va fi și mai mică - % Dezavantajul evident al acestei scheme este că un rând poate fi stocat în cache doar de un singur nod Pentru ca rândurile să fie stocate în cache pe mai multe noduri, aveți nevoie de o modalitate de a le găsi (de exemplu, pentru a invalida sau a actualiza la scriere) Sunt posibile diverse opțiuni O opțiune este de a furniza fiecare intrare de director cu k câmpuri pentru a identifica alte noduri, permițând ca fiecare rând să fie stocat în cache pe mai multe noduri (până la k noduri) A doua opțiune este înlocuirea câmpului cu numărul nodului cu un bitmap, câte un bit per nod Nu există restricții privind numărul de copii, dar costurile generale cresc semnificativ Un director care conține de biți pentru fiecare linie de cache de de octeți ( de biți) necesită mai mult de % din memorie O a treia opțiune este de a stoca un câmp de biți în fiecare intrare de director și de a utiliza acel câmp ca antet al unei liste conectate care unește toate copiile liniei de cache Această strategie necesită spațiu suplimentar la fiecare nod pentru pointerii listei legate În plus, trebuie să răsfoiți lista pentru a găsi toate copiile dacă este necesar Fiecare dintre cele trei strategii are propriile sale avantaje și dezavantaje În practică, sunt folosite toate cele trei strategii Capitolul Arhitecturi de calculatoare paralele O altă problemă cu această schemă este cum să verificați dacă memoria originală este actualizată sau nu Dacă se dorește să citească o linie de cache care nu sa schimbat, cererea poate fi satisfăcută din memoria principală fără a fi nevoie să direcționeze cererea către cache Dacă doriți să citiți o linie cache modificată, cererea trebuie direcționată către nodul în care se află această linie cache, deoarece există doar o copie validă a acesteia Dacă este permis să aveți o singură copie a liniei cache, așa cum se arată în Fig , nu are rost să monitorizăm modificările la liniile de cache, deoarece orice cerere nouă necesită transmiterea unui mesaj către copia existentă pentru a o invalida Desigur, păstrarea informațiilor despre starea fiecărei linii de cache (curată sau murdară) necesită informarea nodului sursă despre fiecare modificare a liniei de cache, chiar dacă există o singură copie a acestei linii Dacă există mai multe astfel de copii, schimbarea uneia dintre ele înseamnă că toate celelalte trebuie declarate invalide, deci este nevoie de un protocol pentru a evita situația de cursă De exemplu, pentru a schimba o linie cache partajată, unul dintre deținătorii acelei linii ar putea solicita acces exclusiv la aceasta înainte de a o schimba O astfel de cerere ar invalida toate celelalte copii Alte optimizări posibile pentru mașinile CC-NUMA sunt discutate în [ ] Multiprocesor Sun Fire E K NUMA Ca exemplu de mașini NUMA cu memorie partajată, luați în considerare familia de multiprocesoare Sun Fire de la Sun Microsystems Există multe modele diferite în această familie, dintre care vom lua în considerare multiprocesorul E K care conține de procesoare UltraSPARC IV La baza lor, fiecare dintre aceste procesoare este o pereche de procesoare UltraSPARC III Cu cu memorie cache și memorie partajată Sistemul E K diferă doar prin faptul că folosește procesoare unice în loc de procesoare duale În familie există și modele mai simple, dar ne interesează să aflăm cum funcționează modelele cu numărul maxim de procesoare Sistemul E K conține seturi de plăci, fiecare set constând dintr-o placă de memorie procesor, o placă I/O cu patru sloturi PCI și o placă de expansiune Placa de expansiune combină procesorul-memorie și plăcile I/O în perechi, conectând aceste perechi la panoul central, care transportă plăcile rămase și asigură comutarea acestora Fiecare procesor-placă de memorie conține procesoare și module RAM de GB Astfel, fiecare procesor-placă de memorie are procesoare și GB RAM (pentru E K - procesoare și același număr de GB RAM) În total, sistemul E K are de procesoare, GB de memorie și de sloturi PCI, așa cum se arată în Figura În mod curios, numărul a fost ales doar din considerente de dimensiune: un sistem de seturi de scânduri este cel mai mare sistem care poate fi adus într-o ușă fără a fi demontat În timp ce programatorii se gândesc doar la zerouri și la unu, dezvoltatorii trebuie să se gândească, printre altele, la modul în care cumpărătorul își va aduce creația în casă Pentru a conecta seturi de plăci, panoul central are trei circuite de interconectare x - câte un circuit pentru liniile de adresă Multiprocesoare niya, răspunsuri și date Pe lângă cele seturi de plăci, în panoul central este introdusă o placă de control al sistemului, care conține, pe lângă procesor, interfețe pentru conectarea unei unități de disc, o unitate de bandă, linii seriale și alte periferice necesare pentru pornirea sistemului, suport si control Memorie Memorie Memorie Memorie ] Conector PCI ] Conector PCI Placa de control al sistemului CPU- CPU - ? CPU- CPU-I Și procesor-placi de memorie Memoria CPU Memoria CPU Memoria CPU Memoria CPU Conector PCI li :i r - conector PCI EZZZZJ ii plăci I/O Slot PCI Orez, , Multiprocesor Sun Microsystems E K Subsistemul de memorie este inima oricărui multiprocesor Cum este conectată memoria distribuită la de procesoare? Abordările simple, adică o magistrală de urmărire comună mare sau un circuit de trecere x , sunt de puțină folos în acest caz Prima opțiune este proastă deoarece magistrala comună devine blocajul întregului sistem, iar a doua nu este bună pentru că este dificil și costisitor să dezvoltați un astfel de comutator Prin urmare, multiprocesoarele mari, cum ar fi E K, trebuie inevitabil să utilizeze subsisteme de memorie non-triviale La nivelul setului de placă, logica snooping asigură că fiecare procesor poate verifica cererile primite cu lista de blocuri din memoria cache locală Când procesorul accesează un cuvânt de memorie, mai întâi convertește adresa virtuală într-o adresă fizică și verifică dacă blocul dorit este în cache (Adresele fizice sunt de de biți, dar din cauza cerințelor de spațiu, memoria este limitată la GB ) Dacă blocul dorit este găsit în propriul cache, cuvântul solicitat este returnat În caz contrar, logica de urmărire verifică dacă blocul dorit există în cadrul aceluiași set de plăci Dacă este, atunci cererea este executată În caz contrar, după cum se arată mai jos, cererea este trimisă prin intermediul Capitolul Arhitecturi de calculatoare paralele comutarea încrucișată a liniilor de adresă Logica de urmărire este capabilă să deservească o cerere pe ceas Deoarece ceasul sistemului este de MHz, pot fi procesate de milioane de solicitări pe secundă sau , miliarde de solicitări pe toate cele seturi de plăci Deși în fig logica de urmărire este prezentată ca o magistrală, fizic este o structură arborescentă a dispozitivelor, în sus și în jos, pentru care sunt transmise comenzi Când o adresă este primită de la magistrala PCI sau de la procesor, aceasta trece printr-o conexiune punct la punct la un repetor de adresă, așa cum se arată în Figura De la oricare dintre cele două repetoare, adresa ajunge la placa de expansiune, de unde este transmisă înapoi în arbore la dispozitive Datorită acestei scheme, este posibil să scapi de autobuzul care leagă cele trei plăci Nivelul Nivelul Nivelul Nivelul Fig, , Conexiune pe patru niveluri a blocurilor în Sun Fire E K Liniile punctate indică transferul de adrese, liniile continue indică transferul de date Pentru schimbul de date este utilizată o conexiune pe patru niveluri (Fig ) Această abordare asigură performanțe ridicate La nivelul , perechile de procesoare și unități de memorie sunt conectate prin mici circuite de comutare încrucișată, care sunt, de asemenea, conectate la nivelul Două grupuri de perechi procesor-memorie sunt conectate printr-un al doilea circuit de comutare încrucișată la nivelul Aceste comutatoare sunt realizate sub formă de circuite integrate specifice aplicației Au intrări pentru fiecare rând și fiecare coloană a rețelei de navetă, deși nu sunt folosite toate combinațiile de rânduri și coloane (sau chiar au sens) Toată logica de comutare a plăcii se bazează pe circuite de conexiune încrucișată x Multiprocesoare Fiecare set de plăci este format din trei plăci: o placă de memorie procesor, o placă I/O și o placă de expansiune care conectează cele două plăci anterioare Comutatorul de nivel este situat pe placa de expansiune și conectează memoria însăși și porturile I/O (care sunt mapate în memorie în toate procesoarele UltraSPARC) Toate datele care intră sau ies din setul de plăci trec prin comutatorul de nivel un bloc de de octeți necesită două cicluri Acum, după ce ne-am dat seama cum sunt amplasate componentele, să trecem la memoria partajată La cel mai de jos nivel, spațiul de adrese de GB este împărțit în blocuri de de octeți Acestea sunt elementele indivizibile ale memoriei Fiecare dintre ele are propria tablă "nativă", unde blocul "locuiește" până când este nevoie de el în altă parte Majoritatea blocurilor sunt pe panourile lor de cele mai multe ori Când un procesor are nevoie de un bloc, fie că este de la propria placă sau de la oricare dintre celelalte , mai întâi solicită o copie în propriul cache, apoi lucrează cu copia stocată în cache Deși există două procesoare pe fiecare cip în sistemul E K, ele împărtășesc un spațiu de adrese comun și, prin urmare, un bloc cache comun Fiecare bloc de memorie (și fiecare linie de cache a tuturor cipurilor) poate fi în una dintre cele trei stări: + acces exclusiv (pentru înregistrare); + partajare (pentru citire); + este nevalid (adică gol) Când procesorul trebuie să scrie un cuvânt în memorie sau să-l citească din memorie, în primul rând își verifică propriul cache Dacă blocul nu este găsit acolo, o solicitare locală pentru adresa fizică a blocului este inițiată și difuzată în setul său de bord Dacă blocul dorit este găsit în memoria cache a setului de carduri, logica de urmărire determină că lovitura cache a avut loc și răspunde la cerere Dacă rândul este în acces exclusiv, acesta este transmis procesorului care l-a solicitat, iar copia originală este marcată ca nevalidă Dacă linia este partajată, aceasta nu este transmisă procesorului care a solicitat-o, deoarece memoria însăși trimite un răspuns atunci când linia cache-ului este șters Dacă logica de snooping nu poate găsi o linie de cache sau dacă linia găsită este partajată, o interogare este trimisă prin panoul central către placa nativă a blocului căutat pentru a afla unde se află blocul Starea fiecărui bloc este stocată în biții ECC, astfel încât placa poate afla imediat această stare Dacă blocul nu este partajat sau este partajat de una sau mai multe plăci la distanță, memoria de pe placa nativă va fi actualizată astfel încât placa nativă să poată îndeplini cererea În acest caz, o copie a liniei de cache în două cicluri este transmisă prin circuitul de comutare încrucișată a datelor către procesorul care a solicitat-o Dacă se face o solicitare de citire, se introduc informații în directorul de bord nativ al blocului că un alt client folosește această linie de cache (adică Capitolul Arhitecturi de calculatoare paralele este partajat), iar aceasta finalizează tranzacția Dacă se face o cerere de scriere, tuturor plăcilor care au o copie a blocului (dacă există) li se spune că blocul nu mai este valabil Acest lucru asigură că rămâne doar o copie a blocului după o solicitare de scriere Să presupunem acum că blocul se află în accesul exclusiv al plăcii de la distanță Când placa nativă primește o solicitare, caută adresa plăcii la distanță dorită în director și răspunde la cerere cu un mesaj cu informații despre locul în care se află linia cache Expeditorul trimite apoi un nou mesaj către panoul găsit Când primește o solicitare, răspunde cu linia cache solicitată După aceea, în cazul unei solicitări de citire, linia este marcată ca fiind partajată și o copie a acesteia este trimisă tabloului nativ În cazul unei cereri de scriere, respondentul își invalidează copia, acordând astfel expeditorului cererii o copie exclusivă Deoarece fiecare card conține de blocuri de memorie, directorul ar trebui să aibă de intrări în cel mai rău caz Deoarece este de fapt mult mai mic, se poate dovedi că directorul (care este căutat asociativ) nu are loc pentru unele intrări În acest caz, setul de plăci nativ ar trebui să transmită o solicitare către toate celelalte seturi de plăci pentru a localiza blocul Responsabilitatea pentru menținerea coerenței directorului și executarea protocolului de actualizare revine circuitului de răspuns încrucișat, care gestionează cea mai mare parte a traficului înapoi către expeditor Datorită separării traficului de protocol pe două magistrale (adrese și răspunsuri) și transferului de date pe a treia, debitul general al sistemului poate fi menținut la un nivel ridicat Distribuind sarcina între diferite dispozitive pe diferite plăci, Sun Fire E K poate funcționa la performanțe foarte înalte Valoarea de , miliarde de cereri pe secundă a fost deja menționată mai devreme Panoul central este capabil să suporte nouă schimburi de date simultane cu nouă plăci emițătoare și nouă plăci receptor Deoarece schema de interconectare a datelor are o lățime de de octeți, de octeți de date pot fi transferați pe ciclu de ceas La o viteză de ceas de MHz, aceasta oferă un debit maxim de GB/s atunci când toate apelurile sunt direcționate către cardurile de la distanță Dacă este posibilă aranjarea programatică a paginilor de memorie astfel încât majoritatea acceselor să fie locale, debitul maxim al sistemului va depăși semnificativ această valoare Pentru mai multe informații tehnice despre Sun Fire E K, consultați [ , ] multiprocesoare SOMA Mașinile NUMA și CC-NUMA au un dezavantaj serios: accesările la memorie de la distanță sunt mult mai lente decât cele locale Într-o mașină CC-NUMA, această diferență de performanță este compensată într-o oarecare măsură de memoria cache Cu toate acestea, dacă cantitatea de date de la distanță solicitată este mult mai mare decât capacitatea memoriei cache, pierderile de cache vor apărea în mod constant, având un impact negativ asupra performanței Multiprocesoare Știm deja că mașinile UMA au o performanță destul de ridicată, dar numărul de procesoare din ele este mic și, în plus, sunt destul de scumpe Aparatele NC-NUMA se scalează bine, dar necesită alocarea manuală sau semi-automată a paginilor, adesea cu rezultate dezastruoase Cert este că este foarte greu să prezici unde și de ce pagini ai putea avea nevoie și, în plus, paginile sunt greu de mutat din cauza dimensiunilor lor mari Mașinile CC-NUMA, cum ar fi multiprocesorul Sun Fire E K, devin foarte lente atunci când un număr mare de procesoare necesită cantități mari de date de la distanță Într-un fel sau altul, fiecare dintre aceste scheme are dezavantaje semnificative Cu toate acestea, există un multiprocesor care rezolvă toate aceste probleme folosind memoria principală a fiecărui procesor ca memorie cache Acest sistem se numește COMA (Cache Only Memory Access) În ea, paginile nu au propriile lor mașini "acasă", ca în sistemele NUMA și CC-NUMA, de fapt, paginile din acest sistem nu au deloc "acasă" În schimb, spațiul de adrese fizice este împărțit în linii cache, care sunt deplasate liber în jurul sistemului la cerere Blocurile de memorie nu au propriile lor mașini Ei, ca și nomazii din unele țări din Lumea a Treia, au o casă unde se întâmplă Memoria care atrage șiruri după cum este necesar se numește atragerea memoriei Utilizarea memoriei principale ca cache mare crește rata de accesare a memoriei cache și, prin urmare, performanța Din păcate, nimic nu este perfect Există două probleme noi cu sistemul SOMA: + Cum sunt alocate liniile cache? + Ce să faci când șirul care este eliminat din memorie este ultima copie? Prima problemă este legată de următorul fapt După cum știți, managerul de memorie realizează traducerea unei adrese virtuale într-una fizică Dacă, după traducere, se dovedește că linia nu se află în cache-ul hardware "adevărat", este foarte greu de spus dacă linia dorită este deloc în memoria principală sau nu este acolo Suportul hardware pentru paginarea în memorie nu va ajuta aici, deoarece fiecare pagină constă dintr-un număr mare de linii cache separate care sunt situate independent unele de altele în sistem Chiar dacă se știe că linia nu este în memoria principală, cum să afli unde se află? În acest caz, nu puteți întreba mașina "acasă" a paginii pierdute despre acest lucru, deoarece pur și simplu nu există o astfel de mașină în sistem Au fost propuse mai multe soluții la această problemă Pentru a ști dacă o linie de cache este sau nu în memoria principală, o etichetă specială poate fi suportată în hardware pentru fiecare linie de cache Managerul de memorie poate compara apoi eticheta liniei dorite cu etichetele tuturor liniilor de cache până când este găsită o potrivire O altă soluție este să afișați pagini întregi, dar să nu solicitați ca toate liniile cache să fie prezente Apoi, pentru fiecare pagină, va fi necesară construirea unui bitmap în hardware, unde fiecare linie corespunde cu bit, care va indica prezența sau absența acestei linii În această schemă, care se numește Capitolul Arhitecturi de calculatoare paralele schemă COMA simplă, dacă o linie este prezentă, aceasta trebuie să fie în poziția corectă pe pagina sa Dacă lipsește, atunci orice încercare de utilizare ar trebui să arunce o excepție, care vă va permite să găsiți și să utilizați în mod programatic linia dorită Astfel, sistemul va căuta doar rândurile care sunt de fapt în memoria de la distanță O altă soluție este să dai fiecărei pagini o mașină "acasă" (acasă în sensul că îi este alocată o intrare în director, nu în sensul că datele sunt stocate pe această mașină) Apoi, pentru a vă da seama unde să căutați un șir, puteți trimite un mesaj la aparatul său de acasă O altă soluție este să organizați memoria într-o structură arborescentă și să căutați în sus până când este găsit un șir A doua problemă este legată de ștergerea ultimei copii Ca și în cazul unei mașini CC-NUMA, o linie de cache poate locui în mai multe noduri în același timp Dacă apare o pierdere a memoriei cache, linia trebuie citită, ceea ce înseamnă de obicei că este ștearsă Ce se întâmplă dacă rândul selectat este ultima copie? În acest caz, nu poate fi șters O soluție posibilă este să te întorci la director și să verifici dacă există alte copii Dacă da, atunci linia poate fi ștearsă în siguranță Dacă nu, trebuie plasat undeva O altă soluție este să marcați una dintre copiile fiecărei linii cache ca master și să nu o ștergeți niciodată Cu această abordare, nu va trebui să verificați directorul În orice caz, o mașină COMA are potențialul de a avea performanțe mai bune decât CC-NUMA, dar până acum au fost construite doar câteva mașini COMA și este nevoie de ceva experiență pentru a le realiza întregul potențial Primele aparate COMA au fost KSR- [ ] și Data Diffusion Machine [ ] Un exemplu mai recent este SDAARC [ ] Multicalculatoare După cum se arată în fig , categoria MIMD include două tipuri de procesoare cu arhitectură paralelă: multiprocesoare și multicalculatoare În secțiunea anterioară, ne-am uitat la multiprocesoare Am aflat că multiprocesoarele pot avea memorie partajată, care este accesată prin instrucțiunile obișnuite LOAD și STORE O varietate de scheme pot fi utilizate pentru a implementa o astfel de memorie, inclusiv magistralele de urmărire, rețelele cu comutare încrucișată și cu mai multe etape și diverse scheme bazate pe directoare În toate cazurile, programele scrise pentru multiprocesor pot accesa orice locație din memorie fără a avea cunoștințe despre topologia internă sau schema de implementare Datorită acestei iluzii, multiprocesoarele sunt foarte populare printre utilizatori și programatori Cu toate acestea, multiprocesoarele au și unele dezavantaje, iar acest lucru înseamnă automat că rolul multicomputerelor se întărește În primul rând, multiprocesoarele nu se scalează bine Știm deja câte dispozitive diferite au avut nevoie inginerii Sun pentru a pune în sistemul E K pentru a suporta de procesoare În ceea ce privește multicalculatoarele, Multicalculatoare apoi vom lua în considerare un sistem de de procesoare Vor trece ani înainte ca cineva să poată construi un multiprocesor comercial cu de noduri, iar până atunci vor exista multicalculatoare cu milioane de procesoare în uz Mai mult, performanța unui multiprocesor poate fi serios afectată de disputa pentru accesul la memorie Dacă de procesoare încearcă în mod constant să citească și să scrie aceleași variabile, disputele pentru resursele pentru modulul de memorie, magistrala și directorul pot afecta puternic performanța Datorită acestor și altor factori, dezvoltatorii manifestă un interes sporit pentru astfel de arhitecturi paralele de computere, în care fiecare procesor are propria memorie care nu este direct accesibilă altor procesoare Acestea sunt multicalculatoare Deoarece programele de pe diferite procesoare dintr-un multicomputer nu pot accesa memoria altor procesoare cu instrucțiunile LOAD și STORE, ele comunică între ele folosind primitivele de trimitere și recepție care sunt folosite pentru a transmite mesaje Această diferență schimbă complet modelul de programare Fiecare nod dintr-un multicomputer constă dintr-unul sau mai multe procesoare, RAM (partajată doar de procesoarele acelui nod), o unitate de disc și/sau alte dispozitive I/O și un procesor de comunicații Procesoarele de comunicație sunt interconectate printr-o rețea de comunicații de mare viteză (vezi subsecțiunea "Rețele de comunicații" de mai jos) Sunt utilizate multe topologii diferite, scheme de comutare și algoritmi de selecție a căii, dar toate multicalculatoarele au un lucru în comun: atunci când un program execută o primitivă de trimitere, procesorul de comunicație este notificat și trimite un bloc de date către mașina țintă (posibil după o cererea prealabilă și permisiunea) Schema generalizată a multicomputerului este prezentată în fig Orez Diagrama multicomputer Rețele de comunicații După cum se arată în fig , multicalculatoarele comunică între ele prin rețele de comunicații Să le luăm în considerare mai detaliat Este interesant de observat că Capitolul Arhitecturi de calculatoare paralele multicalculatoarele și multiprocesoarele sunt foarte asemănătoare în acest sens, deoarece multiprocesoarele conțin adesea mai multe module de memorie care trebuie să comunice și între ele și cu procesoarele În consecință, mare parte din ceea ce vom vorbi în această subsecțiune se aplică ambelor tipuri de arhitecturi de computere paralele Motivul principal pentru asemănarea legăturilor de comunicație într-un multiprocesor și un multicomputer este că în ambele cazuri are loc transmiterea mesajelor Chiar și într-o mașină uniprocesor, atunci când procesorul trebuie să citească sau să scrie un cuvânt, activează anumite linii pe magistrală și așteaptă un răspuns Acest lucru este aproximativ același cu mesajul: inițiatorul trimite o solicitare și așteaptă un răspuns La multiprocesoarele mari, atunci când comunică între procesoare și memoria de la distanță, procesorul aproape întotdeauna trimite un mesaj în memorie, așa-numitul pachet, în care sunt solicitate anumite date, iar memoria trimite un pachet de răspuns către procesor Topologie Topologia unei rețele de comunicații determină dispunerea liniilor de comunicație și a comutatoarelor (poate fi, de exemplu, un inel sau o rețea) Se obișnuiește să se descrie topologia rețelelor sub formă de grafice în care arcurile corespund liniilor de comunicație, iar nodurile corespund comutatoarelor (Fig ) Fiecare nod din rețea (sau din graficul corespunzător) are asociat un set specific de legături de comunicație Matematicienii numesc numărul de linii gradul nodului, inginerii - factorul de ramificare Cu cât gradul este mai mare, cu atât mai multe opțiuni de rută și toleranța la erori este mai mare Dacă fiecare nod conține k arce și conexiunile sunt realizate corect, este posibil să se construiască o rețea de comunicații astfel încât să rămână complet conectată chiar dacă k - linii sunt deteriorate Următoarea caracteristică a unei rețele de comunicații este diametrul acesteia Dacă considerăm că distanța dintre două noduri este numărul de arce care trebuie trecute pentru a ajunge de la un nod la altul, atunci diametrul graficului este distanța dintre cele două noduri situate cel mai departe unul de celălalt Diametrul rețelei determină cea mai mare întârziere în transferul pachetelor de la un procesor la altul sau de la procesor la memorie, deoarece fiecare transfer prin linia de comunicație durează o anumită perioadă de timp Cu cât diametrul este mai mic, cu atât performanța este mai mare Distanța medie dintre o pereche de noduri este, de asemenea, de mare importanță, deoarece timpul mediu de transmisie a pachetelor depinde de aceasta O altă caracteristică importantă a unei rețele de comunicații este lățimea de bandă, adică cantitatea de date pe care o poate transmite pe secundă Cea mai utilă măsurătoare de debit este debitul de secțiune Pentru a calcula această valoare, trebuie să împărțiți mental rețeaua de comunicații în două părți egale (din punct de vedere al numărului de noduri) neconectate, eliminând un număr de arce din grafic și apoi să calculați debitul total al arcelor eliminate Debitul unei secțiuni este debitul minim (pentru toate opțiunile disponibile) De exemplu, o secțiune transversală de bps înseamnă că, dacă există multe legături între două părți ale rețelei, debitul total va fi de numai bps în cel mai rău caz Potrivit multor dezvoltatori, trecerea Multicalculatoare Capacitatea transversală este cea mai importantă caracteristică a unei rețele de comunicații Adesea, obiectivul principal stabilit de proiectanții unei rețele de comunicații este de a obține debitul maxim al unei secțiuni Orez, Diverse topologii Punctele aldine corespund comutatoarelor Procesoarele și modulele de memorie nu sunt afișate: stea (a); relație completă (b); copac (în); inel (g); zăbrele (d); dublu torus (e); cub (w); hipercub cu patru dimensiuni (h) Rețelele de comunicații pot fi caracterizate prin dimensiunile lor Dimensiunea este determinată de numărul de opțiuni posibile pentru trecerea de la sursă la receptor Dacă nu există nicio opțiune (adică există o singură cale de la fiecare sursă la fiecare chiuvetă), atunci rețeaua este zero-dimensională Dacă sunt două posibile Capitolul Arhitecturi de calculatoare paralele opțiune (de exemplu, fie la est, fie la vest), atunci rețeaua este unidimensională Dacă există două axe, iar pachetul poate merge spre est sau vest, sau nord sau sud, atunci se spune că o astfel de rețea este bidimensională și așa mai departe Pe fig prezintă mai multe topologii Aici sunt afișate doar liniile de comunicație și comutatoarele (sub formă de puncte) Modulele de memorie și procesoarele (nu sunt prezentate în figură) sunt conectate la comutatoare prin interfețe Pe fig a prezintă o configurație stea zero-dimensională, în care procesoarele și modulele de memorie sunt conectate la noduri externe, iar comutarea este efectuată de nodul central O astfel de schemă este foarte simplă, dar într-un sistem mare, comutatorul central va fi blocajul sistemului În ceea ce privește toleranța la erori, aceasta este, de asemenea, o schemă foarte nefericită, deoarece defecțiunea unui comutator central provoacă prăbușirea întregului sistem Pe fig , b prezintă o altă topologie zero-dimensională - interconectare completă Aici, fiecare nod este conectat direct la toate celelalte Într-o astfel de schemă, debitul secțiunii este maxim, diametrul este minim și toleranța la erori este foarte mare (chiar și cu pierderea a șase linii de comunicație, sistemul rămâne complet conectat) Cu toate acestea, pentru k noduri, sunt necesare k(k - )/ canale, iar acest lucru este complet inacceptabil pentru valori mari ale lui k Următoarea topologie este un arbore (Fig , c) Aici principala problemă este că lățimea de bandă a secțiunii este egală cu lățimea de bandă a liniei de comunicație De obicei, traficul principal este observat în vârful arborelui, astfel încât nodurile superioare devin blocajul întregului sistem Pentru a rezolva această problemă, este necesar să creșteți debitul secțiunii prin creșterea debitului legăturilor superioare De exemplu, legăturile cele mai de jos ar putea avea capacitatea b, următorul strat ar putea fi al -lea, iar fiecare legătură din stratul superior ar putea fi al -lea O astfel de schemă, numită arbore gras, a fost folosită în multicomputerele comerciale CM- ale Thinking Machines Inelul (Figura d) este o topologie unidimensională deoarece fiecare pachet trimis poate merge la dreapta sau la stânga O grilă sau grilă (Figura , ) este o topologie bidimensională care este utilizată în multe sisteme comerciale Este obișnuit și ușor de scalat, iar diametrul său este rădăcina pătrată a numărului de noduri (adică atunci când sistemul este scalat, diametrul crește ușor) Torul dublu (Fig , e) este un tip de rețea în care marginile sunt conectate Această topologie este mai tolerantă la erori și are un diametru mai mic decât o plasă convențională, deoarece are doar două sărituri între două noduri opuse O altă topologie populară este torul D Această topologie este descrisă de o structură tridimensională ale cărei noduri sunt în punctele (i, j, k), iar toate coordonatele sunt numere întregi în intervalul de la ( , , ) la (/, m, n) Fiecare nod are șase vecini, doi de-a lungul fiecărei axe de coordonate, iar nodurile extreme de pe muchiile opuse sunt conectate între ele, la fel ca în tori bidimensional Cubul (Figura g) este o topologie tridimensională obișnuită Figura arată un cub x x , dar în general ar putea fi un cub k x k x k Figura h prezintă un cub D format din două cuburi D care sunt legate între ele Poate fi realizat în cinci dimensiuni Multicalculatoare cub prin conectarea între ele a cuburi cu patru dimensiuni Pentru a obține dimensiuni, trebuie să duplicați un bloc de cuburi și să conectați nodurile corespunzătoare etc Un cub n-dimensional se numește hipercub (Fig , h) Această topologie este utilizată în multe arhitecturi de computere paralele, deoarece diametrul său depinde liniar de dimensiune Cu alte cuvinte, diametrul este logaritmul de bază al numărului de noduri, deci un hipercub cu dimensiuni are de noduri, dar diametrul este de numai , ceea ce dă foarte puțină întârziere în transferul de date Rețineți că rețeaua de x , care conține și de noduri, are un diametru de , de peste șase ori mai mare decât cel al hipercubului Prețul care trebuie plătit pentru un diametru mai mic de hipercub este o creștere a numărului de ramuri și, prin urmare, a liniilor de comunicație Cu toate acestea, hypercube este soluția de bază pentru sistemele de înaltă performanță Multicomputerele au o asemenea varietate de forme și dimensiuni, încât este foarte dificil să construiți o clasificare inteligibilă pentru ele Cu toate acestea, se pot distinge două "stiluri" principale - acestea sunt procesoare și clustere masiv paralele Le vom lua în considerare pe rând Procesoare masiv paralele Procesoarele Massively Parallel (MPP) sunt supercomputere masive de mai multe milioane de dolari Sunt folosite în diverse ramuri ale științei și tehnologiei pentru a efectua calcule complexe, a procesa un număr mare de tranzacții pe secundă, a gestiona baze de date mari etc Inițial, acestea erau supercalculatoare concepute în principal pentru calcule științifice, dar acum multe dintre ele sunt folosite în comerț Într-un fel, ei sunt moștenitorii mainframe-urilor puternice din anii ' (deși legătura dintre ele este la fel de efemeră ca între o vrabie și un tiranozaur rex) În general, se poate spune că multicalculatoarele MPP au înlocuit mașinile SIMD, supercalculatoarele vectoriale și procesoarele matrice din vârful lanțului trofic al computerelor Majoritatea mașinilor MPP folosesc procesoare standard Acestea pot fi procesoare Intel Pentium, Sun UltraSPARC, IBM RS/ și DEC Alpha Multicomputerele se remarcă prin prezența unei rețele de comunicații de înaltă performanță prin care mesajele pot fi transmise cu latență scăzută și lățime de bandă mare Ambele caracteristici (latența și debitul) sunt foarte importante, deoarece mesajele sunt în general de dimensiuni mici (mai puțin de de octeți), deși mesajele mari (mai mult de KB) au contribuția principală la traficul total Multicomputerele MPP vin cu software și biblioteci foarte scumpe O altă caracteristică a MPP-urilor este cantitățile lor uriașe de I/O Multicomputerele MPP trebuie de obicei să proceseze cantități uriașe de date, uneori teraocteți Aceste date trebuie să fie răspândite pe mai multe discuri și trebuie să fie transferate cu viteză mare între dispozitivele mașinii Capitolul Arhitecturi de calculatoare paralele În cele din urmă, este important să ținem cont de o altă caracteristică a MPP - toleranța la erori Cu mii de procesoare, mai multe erori pe săptămână sunt inevitabile Încetarea unui sistem din cauza unei defecțiuni la unul dintre procesoare este inacceptabilă, mai ales dacă se așteaptă să apară defecțiuni în fiecare săptămână Prin urmare, în mașinile MPP mari, există întotdeauna suport hardware și software specializat pentru monitorizarea continuă a sistemului, detectarea problemelor și corectarea acestora Acum, teoretic, ar fi necesar să se studieze principiile de bază ale organizării mașinilor MPP, dar aceste principii, să spun adevărul, nu sunt deloc multe În această etapă, este suficient să știm că o mașină MPP este o serie de noduri de calcul mai mult sau mai puțin standard conectate între ele printr-o rețea de comunicații de mare viteză Prin urmare, mai jos vom lua în considerare doar câteva exemple specifice de mașini MPP, în special BlueGene și Red Storm bluegene Ca prim exemplu de procesor cu paralelism masiv, luați în considerare sistemul IBM BlueGene Acest proiect a fost conceput de IBM în ca un supercalculator pentru rezolvarea unor probleme de calcul de mare complexitate în biologie În special, biologii cred că funcțiile unei proteine sunt determinate de structura sa tridimensională Dar determinarea formei chiar și a unei mici molecule de proteină pe supercalculatoarele din acea vreme ar fi necesitat câțiva ani de calcul În același timp, în corpul uman există aproximativ jumătate de milion de proteine diferite, dintre care unele sunt extrem de complexe, iar încălcările structurii oricăreia pot duce la boli ereditare grave În mod evident, calcularea structurii tridimensionale a tuturor proteinelor umane necesită mai multe ordine de mărime mai multă putere de calcul, iar modelarea formei unei molecule de proteine este doar una dintre sarcinile pe care proiectul BlueGene își propune să le rezolve Sarcini la fel de complexe din dinamica moleculară, modelarea climei, astronomie și chiar modelarea financiară necesită, de asemenea, supercalculatoare îmbunătățite Simțind nevoia pieței de supercomputere, IBM a investit de milioane de dolari în dezvoltarea și construcția BlueGene În noiembrie , a apărut primul client al primului computer din familia BlueGene numit BlueGene / L Clientul a fost Laboratorul Național Livmore, care funcționează sub supravegherea Departamentului de Energie al SUA Scopul proiectului BlueGene a fost de a construi o mașină MPP care să fie nu numai cea mai rapidă, ci și cea mai eficientă în termeni de teraflop/dolar, teraflop/watt și teraflop/m Din acest motiv, IBM a abandonat principiile care au stat la baza dezvoltării mașinilor MPP anterioare, conform cărora erau utilizate cele mai rapide componente, indiferent de costul acestora În schimb, s-a decis să-și lanseze propria componentă cu un singur cip, care funcționează la o viteză moderată și cu un consum redus de energie, pentru a construi o mașină mare, cu un layout eficient al componentelor pe baza acesteia Primul cip a apărut în iunie , iar primul trimestru al BlueGene / L de de noduri de calcul a fost complet operațional în noiembrie În același timp, a fost certificat Calculatoare multiple Wana este cel mai rapid supercomputer de pe Pământ, cu o performanță de teraflopi/s Cu un consum de energie de , megawați, acest sistem a fost și un câștigător de clasă în cursa eficienței energetice cu , megaflops/watt În total, sistemul ar trebui să conțină de noduri Inima sistemului BlueGene/L este un nod format dintr-un microcircuit specializat, a cărui structură este prezentată în fig Este format din două nuclee PowerPC care rulează la MHz PowerPC este un procesor superscalar dublu canalizat popular în sistemele încorporate Fiecare nucleu are o pereche de unități duble în virgulă mobilă (Floating Point Unit, FPU), care în total vă permit să executați instrucțiuni în virgulă mobilă într-un singur ciclu Aceste blocuri sunt suplimentate cu suport pentru comenzi SIMD, care pot fi utile la procesarea matricelor Astfel, din punct de vedere al performanțelor, acest procesor nu poate fi clasat printre campioni Procesor South Ethernet Partea de jos Orez Microprocesor specializat în sistemul BlueGene/L Cele două procesoare de pe acest cip sunt identice, dar sunt programate separat Primul este propus pentru a fi folosit pentru calcule, iar al doilea - pentru interacțiunea cu restul de de noduri Cipul acceptă trei niveluri de stocare în cache Primul nivel cache este separat, are KB pentru comenzi și alți KB pentru date Cache-urile L de pe cele două procesoare nu sunt consistente deoarece nucleele standard PowerPC nu acceptă această caracteristică și s-a decis să nu le modifice special pentru acest proiect Dimensiunea cache-ului L combinat este de KB În realitate, acestea nu sunt atât cache-uri, cât buffer-uri de preluare preliminară În cache-urile de al doilea nivel Capitolul Arhitecturi de calculatoare paralele se numește un mecanism de urmărire reciprocă, datorită căruia le este menținută consistența Al treilea nivel este reprezentat de un cache contigu de MB care este partajat de ambele cache de nivel al doilea Un acces la memorie care provoacă o pierdere a memoriei cache la primul nivel și o atingere a memoriei cache la al doilea nivel este procesat ȘI ceasuri Cu o pierdere de cache la al doilea nivel, o lovitură de cache la al treilea nivel este deja procesată timp de de cicluri În cele din urmă, în cazul unei pierderi de cache la al treilea nivel, trebuie accesată memoria principală (DDR SDRAM), ceea ce durează aproximativ de cicluri Un mic modul de memorie (SRAM) este conectat la cache-urile de al doilea nivel Modulul SRAM, la rândul său, este conectat la pinii JTAG și este destinat pentru depanare, încărcare și interacțiune cu gazda principală care stochează stiva de sistem, precum și furnizarea de semafore și alte mijloace de sincronizare Pentru un nivel superior, în IBM a fost dezvoltată o placă specializată, pe care este instalată o pereche de microcircuite descrise, precum și GB RAM În versiunile viitoare, placa ar trebui să instaleze până la GB de memorie Microcircuitul este prezentat în , iar placa este prezentată în fig b MB /SDRAM ? -MBg/ 'SDRAM EI; SSSi ! Sistem de rack pentru panouri IC chipsuri plăci panouri rafturi GB cipuri plăci panouri GB cipuri plăci GB cipuri TB a B C D E Orez BlueGene/L: cip (a), placă (b), panou (c), rack (d), sistem (e) Plăcile sunt montate pe un panou încastrat, plăci pe panou, ceea ce oferă de cipuri (adică de procesoare de calcul) pe panou Deoarece fiecare placă are un SDRAM de GB, placa are un total de GB de memorie (Fig , c) La nivelul următor, dintre aceste panouri sunt introduse în partea de sus a rackului, celelalte în partea de jos, rezultând un rack de x cm M ulticalculatoare procesoare Cele două grupuri de panouri sunt separate printr-un comutator, datorită căruia un grup poate fi scos din sistem pentru întreținere, în timp ce se conectează un grup de rezervă Standul este prezentat în fig ora În cele din urmă, întregul sistem, constând din de procesoare de calcul și de procesoare de comunicații, este prezentat în Fig , e Cu de unități aritmetice duble întregi și de unități duble cu virgulă mobilă, sistemul trebuie să proceseze până la de instrucțiuni pe ciclu Cu toate acestea, una dintre unitățile aritmetice întregi este dedicată pregătirii datelor pentru unitățile în virgulă mobilă, astfel încât debitul maxim scade la de instrucțiuni pe ciclu sau , x IO instrucțiuni pe secundă Astfel, acest sistem este cel mai mare computer construit vreodată în lume Sistemul este un multicomputer în sensul că niciunul dintre procesoare nu are acces direct la memorie, cu excepția celor MB de memorie nativă de pe placă Nicio pereche de procesoare nu are memorie partajată De asemenea, apelarea paginilor la cerere nu este acceptată deoarece nu există discuri locale care să găzduiască paginile În schimb, sistemul are de noduri I/O care se conectează la unități și alte periferice În ciuda dimensiunii excepționale a sistemului, acesta este destul de simplu și nu folosește nicio tehnologie specială, cu excepția poate pentru plasarea nodurilor extrem de dense Nu este o coincidență, deoarece obiectivele principale erau fiabilitatea și disponibilitatea În consecință, sistemele de alimentare, sistemele de răcire, sistemele de cabluri etc , au fost proiectate foarte atent, toate acestea făcând posibilă creșterea timpului mediu dintre defecțiuni la zile Conectarea tuturor cipurilor necesită o interconectare scalabilă și de înaltă performanță Ca topologie a fost ales un tor tridimensional cu dimensiunea de x x Astfel, fiecare cip necesită linii de comunicație: pentru vecinii amplasați logic deasupra și dedesubt, pentru vecinii din nord și sud, pentru vecinii din vest și est (vezi simbolurile corespunzătoare din Fig ) Din punct de vedere structural, fiecare rafturi pentru noduri formează un torus de x x O pereche de rafturi adiacente sunt conectate la un tor de x x Patru perechi de rafturi de pe un rând formează un torus de x x și, în cele din urmă, toate cele rânduri dau un torus care măsoară x x Astfel, toate conexiunile sunt punct la punct și funcționează la , Gbps Deoarece există trei legături de la fiecare dintre cele de noduri către nodurile "următoare în ordine", câte una pentru fiecare dimensiune, debitul total al sistemului este de TB/s Capacitatea de informații a cărții pe care o țineți în mână, inclusiv desenele PostScript încapsulate, este de aproximativ de milioane de biți, astfel încât BlueGene/L poate transfera până la de copii ale acesteia într-o secundă Unde să puneți aceste copii și cine le-ar putea citi - lăsăm aceste întrebări cititorului Interacțiunea într-un torus D este susținută sub formă de rutare virtuală prin tăiere Această abordare este oarecum similară cu comutarea stocare și redirecționare (consultați secțiunea Coprocesoare), cu excepția faptului că înainte de a trece mai departe cu Capitolul Arhitecturi de calculatoare paralele pachetele de legături nu sunt salvate în întregime De îndată ce următorul octet al pachetului ajunge la nodul de tranzit, acesta este transmis mai departe de-a lungul rutei fără a aștepta primirea întregului pachet Sunt permise atât rutarea dinamică (adaptativă), cât și cea statică (fixă) Pentru a implementa rutarea virtuală end-to-end, există mai multe dispozitive specializate pe cip Pe lângă torul D principal care asigură comunicarea, există și alte rețele de comunicații A doua rețea are o structură arborescentă În sistemele extrem de concurente, cum ar fi BlueGene/L, multe operațiuni necesită participarea tuturor nodurilor Ca exemplu, luați în considerare problema găsirii celei mai mici dintre de valori, fiecare dintre acestea fiind stocată într-un nod separat Dacă toate nodurile sunt conectate într-o structură arborescentă, fiecare două noduri își pot trimite valorile către nodul superior, care îl poate alege pe cel mai mic și îl poate trece mai sus Cu această abordare, doar minimul necesar de informații intră în nodul rădăcină (imaginați-vă dacă fiecare dintre cele de noduri ar transmite direct un mesaj către nodul rădăcină) A treia rețea este utilizată pentru suspendări și întreruperi globale Unii algoritmi necesită execuție în etape, când fiecare nod, după ce și-a încheiat etapa, nu trece la următorul, ci așteaptă până când toți ceilalți termină aceeași etapă O rețea de barieră specială vă permite să setați în mod programatic aceste etape și să suspendați calculele pe toate procesoarele care și-au încheiat etapa înainte de restul Când toți procesoarele își termină etapa, calculul continuă Aceeași rețea de barieră este utilizată pentru întreruperi A patra și a cincea rețea se bazează pe tehnologia Gigabit Ethernet Unul dintre ele conectează nodurile I/O la servere de fișiere non-BlueGene/L și la Internet; celălalt este folosit pentru a depana sistemul Fiecare nod de calcul și comunicații rulează un mic sistem de operare specializat care acceptă un utilizator și un proces Un proces poate avea două fire de execuție de program, câte unul pentru fiecare procesor dintr-un nod Această structură simplă a fost aleasă pentru performanța și fiabilitatea sa ridicată Pentru a îmbunătăți fiabilitatea, o aplicație poate crea un punct de salvare apelând o procedură de bibliotecă După ce rețeaua a terminat de transmis toate mesajele care nu au fost încă transmise, puteți crea un punct de salvare global, astfel încât, în cazul în care sistemul se blochează, lucrarea să poată fi pornită din acest punct și nu de la început Nodurile I/O rulează sistemul de operare tradițional Linux și acceptă multitasking Informații suplimentare despre BlueGene/L pot fi găsite în [ , , , ] Furtuna Rosie Ca un al doilea exemplu de sisteme MPP, luați în considerare Furtuna Roșie a Laboratoarelor Naționale Sandia (numită și ciocanul lui Thor) Laboratorul Sandia efectuează misiuni clasificate și neclasificate pentru Departamentul de Energie al SUA Printre lucrările clasificate se numără simularea exploziilor nucleare, care necesită calcule foarte intense Calculatoare multiple Sandia este în afaceri de mult timp și are de mulți ani cele mai puternice supercomputere Timp de zeci de ani, supercomputerul vectorial a fost preferat aici, dar la un moment dat, datorită dezvoltării tehnologiei și schimbărilor din economie, mașinile MPP au început să le înlocuiască Începând din , mașina MPP folosită atunci numită ASCI Red a început să "alunece" din ce în ce mai mult Deși avea de noduri, împreună au oferit doar , TB de RAM și , TB de spațiu pe disc, iar sistemul în ansamblu s-a luptat să mențină performanța de teraflops/s Așa că în , Sandia a decis să înlocuiască ASCI Red alegând Cray Research ca furnizor pe termen lung de supercalculatoare Noul sistem a fost livrat în august , ceea ce este foarte rapid pentru dezvoltarea și implementarea unei mașini atât de mari Motivul pentru această viteză este că multicomputerul Red Storm este construit aproape exclusiv din componente convenționale disponibile comercial Singura excepție este un cip specializat folosit pentru rutare Pentru Red Storm a fost ales un procesor AMD Opteron Această alegere a fost determinată de câteva dintre caracteristicile sale cheie Primul este menținerea a trei moduri de funcționare În modul vechi, acest procesor poate rula programe Pentium obișnuite fără nicio modificare În modul de compatibilitate, sistemul de operare rulează pe de biți și poate adresa până la de biți de memorie, în timp ce programele de aplicație sunt pe de biți În cele din urmă, în modul pe de biți, întreaga mașină devine pe de biți și poate adresa întreg spațiul de adrese de de biți Mai mult, atât programele pe de biți, cât și pe de biți pot rula simultan în modul pe de biți, ceea ce simplifică actualizările de sistem O altă caracteristică cheie a Opteron este luarea în considerare atentă a lățimii de bandă a memoriei În ultimii ani, procesoarele au devenit din ce în ce mai rapide, depășind semnificativ memoria în această cursă Ca rezultat, în cazul unei pierderi de cache în memoria cache de al doilea nivel, timpul de acces la memorie crește semnificativ Inginerii AMD au instalat un controler de memorie în procesorul Opteron care rulează la frecvența procesorului în loc de frecvența magistralei de memorie, ceea ce îmbunătățește performanța memoriei Controlerul poate gestiona opt DIMM-uri de GB pentru un maxim de GB de memorie Sistemul Red Storm setează - GB pentru fiecare procesor Opteron, dar nu există nicio îndoială că în timp, pe măsură ce memoria devine mai ieftină, această valoare va crește O altă oportunitate de îmbunătățire a performanței sistemului este înlocuirea procesoarelor Opteron cu modele dual-core, care teoretic ar trebui să dubleze puterea de procesare Fiecărui procesor Opteron i se atribuie propriul procesor de rețea dedicat, numit IBM Seastar Acesta este un element critic al sistemului, deoarece aproape tot schimbul de informații între procesoare are loc prin intermediul rețelei Seastar Fără rețeaua de comunicații de mare viteză pe care o suportă aceste cipuri, sistemul s-ar îneca rapid în date În timp ce procesoarele Opteron sunt procesoare disponibile comercial, Red Storm le instalează pe propriile plăci dedicate Capitolul Arhitecturi de calculatoare paralele (Fig ) Fiecare astfel de placă are procesoare Opteron, GB RAM, procesoare Seastar, un procesor RAS (Reliability, Availability and Service), un cip Ethernet de Mbps Un set de opt plăci este instalat în panou și introdus în casetă Fiecare rack are dintre aceste casete, permițându-vă să instalați de procesoare Opteron, precum și sursele de alimentare și sistemul de răcire necesare Întregul sistem este format din rack-uri, oferind de procesoare cu module de memorie SDRAM de TB Fiecare procesor are acces doar la propriul modul SDRAM, nu există memorie partajată Puterea teoretică de calcul a sistemului este de teraflops/s Procesoarele Opteron separate sunt interconectate folosind routere specializate Seastar, câte un router per CPU Ele sunt conectate între ele într-un tor tridimensional care măsoară x x , în fiecare nod din care există un router Fiecare router are linii de comunicație bidirecționale de mare viteză ( Gb/s) Șase dintre ele duc la vecini: nord, est, sud, vest, sus și jos, iar un altul conectează routerul la procesorul Opteron Timpul de transmisie între nodurile rețelei vecine este de µs Este nevoie de µs pentru a parcurge întregul set de noduri de calcul O altă rețea se bazează pe tehnologia Ethernet de Mbps și servește la deservirea și sprijinirea sistemului Calculatoare multiple Pe lângă cele rafturi de calcul, sistemul are rafturi I/O și procesoare de service Fiecare dintre ele are de procesoare Opteron Dintre aceste procesoare, sunt responsabile pentru I/O și pentru întreținere Restul spațiului este ocupat de unități organizate pe nivelurile RAID și , fiecare cu o unitate de paritate și o unitate hot-swap Cantitatea totală de spațiu pe disc este de TB Debitul combinat al sistemului de discuri este de GB/s Sistemul, folosind întrerupătoare mecanice, este împărțit în două părți, secrete și non-secrete, care, dacă este necesar, pot fi separate Din numărul total de procesoare, sunt întotdeauna în secțiunea secretă, alți sunt întotdeauna în cea non-secretă Cele de procesoare de calcul rămase pot fi comutate între secțiuni, așa cum se arată în Fig Toate procesoarele Opteron din secțiunea secretă au GB memorie, toate celelalte au GB I/O și procesoarele de întreținere sunt împărțite între secțiuni I/O și nod de întreținere Intrerupator Nod de calcul □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ TB stocare pe disc V , y J de rafturi secrete ( procesoare Opteron) de rafturi comutabile de rafturi neclasificate ( procesoare Opteron) TB stocare pe disc □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ Orez Sistem Red Storm, vedere de sus Întregul sistem este găzduit într-o clădire separată de m , proiectată și construită pentru a extinde sistemul la de procesoare, dacă este necesar în viitor Consumul de energie al nodurilor de calcul este de , MW, discurile consumă încă MW Împreună cu sistemul de ventilație și aer condiționat, consumul total de energie este de , MW Hardware-ul și software-ul computerului au costat de milioane de dolari, clădirea și ventilația au costat alte milioane de dolari, pentru un total de puțin sub de milioane de dolari, deși o parte din acești bani sunt costuri unice de dezvoltare Adică, dacă vrei să obții o copie exactă, pregătește aproximativ de milioane de dolari În plus, Sgau se așteaptă să vândă versiuni reduse ale sistemului organizațiilor guvernamentale și private sub numele HZT Nodurile de calcul funcționează sub controlul unui nucleu ușor numit Catamount ("pisică sălbatică") Nodurile I/O sunt gestionate de sistemul de operare Linux obișnuit cu câteva completări pentru a sprijini interfața MPI (vezi mai târziu în acest capitol) Nodurile RAS rulează o versiune simplificată de Linux Pe Roșu Capitolul Arhitecturi de calculatoare paralele Storm poate rula o multitudine de programe ASCI Red, inclusiv alocatoare CPU, programatori, biblioteci MPI, biblioteci de matematică, programe de aplicație Pentru un sistem atât de mare, problemele de fiabilitate vin în prim-plan Fiecare placă conține un procesor RAS conceput pentru a deservi sistemul, precum și hardware specializat Scopul dezvoltatorilor a fost realizarea unui MTBF (Meap Time Between Failures - Mean Time Between Failures) egal cu de ore Hardware-ul ASCI Red avea această cifră de de ore, dar sistemul de operare a distrus totul - o defecțiune completă a sistemului a avut loc la fiecare de ore Și deși noul hardware este mult mai fiabil decât vechiul, punctul slab este totuși software-ul Mai multe detalii despre Red Storm pot fi găsite în [ ] Comparație între sistemele BlueGene/L și Red Storm Sistemele BlueGene/L și Red Storm, fiind asemănătoare din multe puncte de vedere, au multe diferențe, așa că este destul de interesantă compararea lor între ele În tabel arată valorile unora dintre parametrii lor cheie Tabelul Comparație între sistemele BlueGene/ și Red Storm Parametrul BlueGene/L Red Storm CPU -bit PowerPC -bit Opteron Frecvență MHz GHz Număr de procesoare de calcul Numărul de procesoare la bord Numărul de procesoare pe rack Număr de rafturi de calcul Performanța teraflop/s Memorie per procesor MB - GB Memorie totală TB TB Router PowerPC Seastar Număr de routere Topologie Dimensiune Tor x x Dimensiune Tor x x Rețele Gigabit Ethernet Fast Ethernet suplimentare Posibilitate de împărțire în secțiuni Nu Da OS pentru noduri de calcul Specializate Specializate I/O OS Linux Linux Producător: IBM Cray Research Cost ridicat ridicat Multicalculatoare Aceste două mașini au fost construite cam în același timp, așa că diferențele dintre ele sunt determinate nu de tehnologie, ci de înclinațiile dezvoltatorilor și, de asemenea, într-o oarecare măsură, de diferențele dintre IBM și Cray Sistemul BlueGene/L a fost conceput de la început ca o mașină comercială pentru vânzare către companii de biotehnologie, farmaceutice și alte companii În schimb, sistemul Red Storm a fost construit personalizat de Sandia Labs, iar Cray intenționează să ofere spre vânzare versiuni reduse ale sistemului Abordarea IBM este foarte simplă: să construiești un microcircuit, deși specializat, dar cu viteză redusă și ieftin în producția de masă, din nuclee existente, și apoi să combine un număr foarte mare de aceste microcircuite cu o rețea nu foarte mare Sandia a adoptat o abordare diferită, dar la fel de înțeleasă: luați cel mai puternic procesor pe de biți de pe piață, echipați-l cu un router personalizat de mare viteză și mai multă memorie, rezultând noduri de calcul mult mai puternice decât nodurile BlueGene/L Astfel de noduri vor necesita mult mai puțin, prin urmare, schimbul de informații între ele va avea loc, respectiv, mai rapid Fiecare decizie a afectat plasarea elementelor într-un mod diferit Datorită faptului că IBM a dezvoltat un cip specializat care a combinat procesorul și routerul, a fost posibil să se obțină o densitate de ambalare mai mare - procesoare într-un rack Sansia a instalat un procesor de masă convențional și - GB de memorie pe nod, astfel încât doar de procesoare de calcul puteau încăpea în rack Ca rezultat, Red Storm ocupă mai mult spațiu și consumă mai multă energie decât BlueGene/L În lumea exotică a laboratoarelor naționale de cercetare, performanța este cheia În acest parametru, BlueGene / L câștigă, deoarece performanța acestui sistem este de teraflopi/s față de teraflopi/s pentru Red Storm Dar nu trebuie să uităm că designul lui Red Storm este extensibil, așa că prin introducerea a încă de procesoare Opteron (prin trecerea la tehnologia dual-core, de exemplu), Sandia poate împinge probabil performanța până la teraflopi/s Cu toate acestea, IBM este capabil să răspundă la aceasta crescând ușor frecvența ceasului (într-adevăr, frecvența de MHz nu este foarte impresionantă) Cu alte cuvinte, supercalculatoarele MPP nu au atins încă limita fizică a puterii lor și vor continua să se dezvolte mulți ani de acum înainte Cluster Computing O altă variantă a unui multicomputer este un computer cluster [ , ] De regulă, un cluster este format din câteva sute sau mii de computere personale sau stații de lucru conectate printr-o rețea și sunt conectate la rețea printr-o placă de rețea convențională Diferența dintre un MPP și un cluster este aceeași ca între un mainframe și un computer personal Ambele au procesor, RAM, discuri, un sistem de operare etc Dar pe mainframe totul (cu posibila excepție a sistemului de operare) rulează mult mai repede și, din această cauză, sunt folosite și gestionate în complet diferit moduri Același lucru se poate spune despre MPP-uri și clustere Capitolul Arhitecturi de calculatoare paralele Până acum câțiva ani, interacțiunea dintre elementele care formează MRR era mult mai rapidă decât între mașinile care alcătuiesc clusterul Cu toate acestea, odată cu apariția rețelelor de mare viteză pe piață, acest decalaj a început să dispară Este probabil ca clusterele să înlocuiască treptat mașinile MMP, la fel cum computerele personale au înlocuit mainframe-urile, care sunt acum folosite doar în domenii foarte specializate Principala nișă pentru sistemele MMP va rămâne supercalculatoarele scumpe, în care principalul lucru este performanța, iar problemele de cost nu sunt decisive Există multe tipuri de clustere, dintre care două domină: centralizate și descentralizate Centralizat este un grup de stații de lucru sau computere personale montate într-o structură mare în aceeași cameră Uneori sunt amplasate mai compact decât de obicei pentru a reduce dimensiunea fizică și lungimea cablului De regulă, toate mașinile incluse în cluster sunt omogene și nu au niciun dispozitiv periferic, cu excepția plăcilor de rețea și, eventual, a unităților de disc Gordon Bell, designerul PDP- și VAX, le-a numit stații de lucru fără cap, sugerând că aceste mașini nu aveau proprietari Clusterele descentralizate constau din stații de lucru sau computere personale împrăștiate într-o clădire sau campus Majoritatea dintre ei stau inactiv multe ore pe zi, mai ales noaptea De obicei, acestea sunt conectate printr-o rețea locală Sunt eterogene și au un set complet de periferice, deși un grup cu o mie de șoareci nu este mai bun decât un grup fără șoareci Cel mai important, multe dintre mașinile din cluster au proprietari, fiecăruia dintre care nu le pasă de mașina lui și nu este foarte loial faptului că vreun astronom încearcă să-l implice în calcule legate de teoria big bang-ului Dacă, pe de altă parte, utilizați numai mașini inactive pentru a organiza clusterul, cu siguranță aveți nevoie de un fel de mecanism de migrare a jobului pentru a elibera mașina atunci când proprietarul are nevoie de el Deși problema migrării locurilor de muncă este destul de rezolvabilă, soluția necesită o complexitate software suplimentară Clusterele sunt adesea mici, variind de la o duzină la poate de computere Cu toate acestea, este posibil să construiți un cluster foarte mare din PC-uri obișnuite Google a venit cu un mod interesant de a face acest lucru, pe care îl vom analiza aici Google Google este un motor de căutare de informații popular pe Internet Își datorează popularitatea simplității interfeței și timpului redus de răspuns, deși elementele interne ale Google pot fi numite orice, decât simple Din punctul de vedere al motorului de căutare, sarcina este de a indexa și stoca întregul World Wide Web (care este de peste miliarde de pagini și un miliard de imagini), apoi găsiți pagina dorită printre informațiile stocate în , secunde, deservește o mie de solicitări pe secundă care vin non-stop din toată lumea În plus, sistemul nu ar trebui să se defecteze niciodată, chiar și în caz de dezastre naturale, întreruperi de curent și rețea, defecțiuni hardware și software Dezvoltarea unei clone Google cu siguranță nu este un exercițiu pentru cititor Multicalculatoare Cum face Google toate acestea? Funcționarea Google este asigurată de multe centre de informare din întreaga lume Acest lucru nu numai că face posibilă înlocuirea în cazul unei inundații sau unui cutremur La accesarea adresei www google com se analizează adresa IP a expeditorului solicitării, iar apoi browserul comunică doar cu centrul de informare cel mai apropiat de acesta Fiecare centru de date este conectat la Internet prin cel puțin o linie de fibră optică OS- ( Gbps), prin care se primesc solicitările și se trimit răspunsurile înapoi În plus, există o linie suplimentară OS- ( Mbps) pentru furnizorul de servicii de rezervă în cazul unei întreruperi în activitatea celui principal Pentru a se asigura că spectacolul poate continua chiar și în timpul întreruperilor de curent, toate centrele au surse de alimentare neîntreruptibile și generatoare diesel de urgență Astfel, în timpul dezastrelor naturale, activitatea Google nu va fi perturbată, deși performanța va scădea Pentru a înțelege mai bine de ce arhitectura Google a devenit așa cum este, este util să vedem cum este procesată o solicitare într-unul dintre centrele de informare Ajungând la hub (pasul din Figura ), cererea este redirecționată de echilibrator de încărcare către unul dintre numeroșii manipulatori de cereri ( ) și, în paralel, către verificatorul ortografic ( ) și serverul de publicitate contextuală ( ) În paralel, căutarea cuvântului solicitat este efectuată pe serverele de index ( ), care stochează înregistrările fiecărui cuvânt pe Web Orez Se procesează o solicitare către Google Capitolul Arhitecturi de calculatoare paralele Fiecare astfel de intrare listează toate documentele care conțin acel cuvânt (acestea pot fi pagini web, fișiere PDF, prezentări PowerPoint etc ) Legăturile din aceste liste sunt aranjate în funcție de rangul paginii, parametru care se calculează folosind o formulă complexă Principiul calculării ratingului este ținut secret, dar se știe că numărul de link-uri către pagină și ratingurile paginilor care leagă la aceasta sunt de mare importanță Pentru a îmbunătăți performanța, indexul este împărțit în bucăți care sunt căutate în paralel Conform acestei idei, fragmentul conține toate cuvintele din index, iar fiecare cuvânt este asociat cu identificatorii primelor n pagini cotate Fragmentul conține toate cuvintele și identificatorii următoarelor n pagini clasate și așa mai departe Pe măsură ce Web-ul crește, fiecare dintre aceste fragmente poate fi împărțit în mai multe părți, astfel încât prima parte va avea primele k cuvinte, a doua următorul k și m e Acest lucru vă permite să obțineți un paralelism și mai mare în căutare Serverele de index returnează seturi de ID-uri de document ( ) care sunt apoi combinate conform logicii de interogare De exemplu: +digita +kapibara +dans Cu o astfel de solicitare, doar identificatorii acelor documente care se află în toate cele trei seturi vor trece la pasul următor În acest pas, Google accesează el însuși documentele ( ), extragând din ele titluri, link-uri, precum și fragmente de text care înconjoară cuvintele solicitate Copii ale multor documente ale Rețelei sunt stocate pe serverele de documente ale tuturor centrelor de informare, în prezent volumul acestora ajungând la sute de terabytes Documentele sunt, de asemenea, împărțite în fragmente pentru a accelera căutarea paralelă Drept urmare, deși procesarea unei interogări nu necesită citirea întregului conținut al rețelei (și procesarea a zeci de terabytes de indici), atunci când deserviți o interogare obișnuită, trebuie totuși să "retorniți" cel puțin MB de date După ce rezultatele sunt returnate la manipulatorul de cereri ( ), acestea sunt combinate în funcție de rangul paginii Sunt adăugate informații despre posibilele erori de ortografie dacă sunt găsite ( ) și publicitate contextuală ( ) Includerea în rezultatele interogării a anumitor cuvinte cheie cumpărate de agenții de publicitate (de exemplu, "hotel" sau "cameră video") este ceea ce Google câștigă bani În cele din urmă, rezultatele sunt formatate în HTML (HyperText Markup Language) și livrate utilizatorului ca o pagină web normală Acum, pe baza cunoștințelor acumulate, putem studia arhitectura Google Majoritatea companiilor, confruntate cu nevoia de a menține o bază de date uriașă și foarte fiabilă, cu un număr mare de tranzacții, achiziționează cele mai rapide și mai fiabile echipamente disponibile pe piață Google a făcut exact invers Au cumpărat computere personale ieftine, cu performanțe medii O mulțime de computere Combinând aceste mașini, au construit cel mai mare grup de componente obișnuite din lume Principiul principal din spatele acestei soluții este simplu - optimizarea raportului preț/performanță Decizia a avut rădăcini în economie: computerele personale obișnuite sunt suficient de ieftine Pentru serverele high-end nu este cazul, ci pentru mari Multicalculatoare multiprocesoare - de două ori greșite De exemplu, performanța unui server puternic poate fi de - ori mai mare decât performanța unui computer mediu, dar de obicei costă de - ori mai scump decât de - ori Desigur, un computer personal ieftin este mult mai puțin fiabil decât cele mai bune modele de servere, dar serverele se blochează uneori Prin urmare, software-ul Google este scris pentru a rula fiabil pe hardware nesigur Având la dispoziție software-ul cu toleranță la erori, nu mai contează prea mult dacă rata de eșec este de , % sau % pe an Experiența Google arată că % din toate computerele se defectează într-un an Mai mult de jumătate dintre defecțiuni sunt cauzate de hard disk-uri, urmate de surse de alimentare, urmate de cipuri de memorie Procesoarele, după rulare, nu se rup deloc De fapt, principala cauză a defecțiunilor nu este hardware-ul, ci software-ul Prin urmare, prima reacție la o eroare este o repornire, care în majoritatea cazurilor rezolvă problema (acesta poate fi numit analogul electronic al rețetei "două aspirine noaptea") Un PC modern tipic folosit de Google are un procesor Pentium de GHz, MB de RAM și GB de stocare Poate că bunica ta își verifică ocazional e-mail-ul pe același aparat Doar cipul Ethernet merită o atenție specială Nu poate fi numită o operă de artă, dar este foarte ieftină Calculatoarele sunt adăpostite în carcase cu înălțimea II (aproximativ cm) și sunt instalate în rafturi verticale, câte de bucăți fiecare din față și din spate Într-un rack, astfel, sunt instalate de mașini, care sunt conectate la Ethernet folosind un comutator din interiorul rack-ului Toate rafturile dintr-un centru de date sunt, de asemenea, conectate la Ethernet printr-un comutator și există comutatoare redundante pentru supraviețuirea la failover Structura unui centru de informare Google tipic este prezentată în Fig Datele de la linia de fibră optică de mare viteză OS- sunt transmise la două switch-uri Ethernet cu de porturi Linia de rezervă OS- este conectată la ei în același mod O placă specială este utilizată pentru a conecta canalele de intrare, astfel încât acestea să nu ocupe porturile comutatoarelor Ethernet Există patru linii Ethernet care ies din fiecare rack, două către comutatorul afișat în stânga și două către dreapta Acest lucru permite sistemului să supraviețuiască defecțiunii oricăruia dintre cele două comutatoare Din cauza celor patru linii, pierderea comunicării cu rack-ul necesită fie ca toate cele patru linii să eșueze, fie două linii și comutatorul să eșueze Cu o pereche de switch-uri cu de porturi și rafturi cu patru linii, de rafturi pot fi conectate în rețea Dacă presupunem că există de computere într-un rack, acest lucru dă un total de de mașini, deși, desigur, nimeni nu cere ca într-un rack să fie exact de computere și chiar și comutatoarele pot avea mai mult de de porturi Doar că acestea sunt valori foarte tipice pentru clusterul Google Consumul specific de energie pe unitatea de suprafață este, de asemenea, de mare importanță Un computer personal tipic consumă aproximativ de wați, oferind kW per rack Este necesar un spațiu de minim m pentru ca personalul de întreținere să instaleze și să scoată computerele din rack Capitolul Arhitecturi de calculatoare paralele Astfel, consumul specific de energie este de W/m De obicei, centrele de date sunt proiectate pentru un consum de energie între și W/m , așa că sunt necesare măsuri speciale pentru răcire fibră optică Orez Cluster Google tipic Google a învățat trei reguli pentru construirea și rularea serverelor web mari, pe care este o idee bună să le reproduc aici Orice componente se rup, iar acest lucru trebuie luat în considerare Pentru a crește debitul și disponibilitatea, totul ar trebui duplicat Este necesara optimizarea raportului pret/performanta Primul punct spune că software-ul trebuie să fie tolerant la erori Chiar și cel mai bun echipament se va sparge mai devreme sau mai târziu dacă este suficient, iar această posibilitate trebuie luată în considerare programatic Un sistem de această dimensiune ar trebui să supraviețuiască eșecurilor, chiar dacă acestea apar de mai multe ori pe săptămână Multicalculatoare Al doilea punct indică faptul că atât software-ul, cât și hardware-ul trebuie să fie redundante Acest lucru nu numai că face ca sistemul să fie tolerant la erori, dar crește și debitul În cazul Google, computerele în sine, unitățile, cablurile, sursele de alimentare și comutatoarele lor sunt duplicate de multe ori În plus, fragmente de indici și documente sunt duplicate într-un singur centru Centrele de informare în sine sunt duplicate Al treilea punct este o consecință a primelor două Dacă sistemul răspunde corect la defecțiuni, este o prostie să cumpărați componente scumpe, cum ar fi matrice RAID sau unități SCSI Chiar și ei se sparg, iar cheltuirea de zece ori mai mult pentru a reduce la jumătate rata de eșec este o idee proastă Este mai bine să cumpărați de zece ori mai multe echipamente și să permiteți posibilitatea defecțiunilor La urma urmei, cu cât mai mult hardware, cu atât performanța este mai bună (când hardware-ul rulează) Pentru mai multe informații despre Google, consultați [ , ] Software de comunicații pentru multicalculatoare Programarea unui multicomputer necesită un software special (de obicei biblioteci) care permite interacțiunea între procese și sincronizare Rețineți că, în majoritatea cazurilor, pachetele software sunt destinate atât mașinilor MPP, cât și clusterelor, astfel încât aplicațiile sunt portabile între platforme În sistemele de mesagerie, două sau mai multe procese funcționează independent unul de celălalt De exemplu, unul dintre procese poate genera date, iar celălalt (sau altele) le consumă Dacă expeditorul are mai multe date, nu există nicio garanție că destinatarii sunt pregătiți să primească aceste date, deoarece fiecare proces rulează pe propriul program Majoritatea sistemelor de mesagerie folosesc cele două primitive send și peset ѵe, dar alte semantice sunt posibile Cele trei opțiuni principale sunt: ♦ mesagerie sincronă; + trecerea mesajului tamponat; + transmiterea mesajului neblocant În mesageria sincronă, dacă expeditorul efectuează o operațiune de trimitere și receptorul nu a efectuat încă o operațiune peset ve, expeditorul blochează (suspend) până când destinatarul efectuează o operațiune peset ve, moment în care mesajul este copiat Când controlul este returnat expeditorului, acesta știe deja că mesajul trimis a fost primit Această metodă are o semantică simplă și nu necesită tamponare Dar are un dezavantaj serios: expeditorul este blocat până când destinatarul acceptă mesajul și îl confirmă În cazul mesageriei în buffer, mesajul trimis este stocat temporar undeva (de exemplu, în cutia poștală) până când destinatarul este gata să-l ridice de acolo Cu această abordare, expeditorul poate continua să lucreze chiar și după finalizarea operațiunii de trimitere, chiar dacă destinatarul în acel moment Capitolul Arhitecturi de calculatoare paralele ocupat Deoarece mesajul a fost deja trimis, expeditorul poate utiliza imediat din nou tamponul de mesaje Această schemă reduce timpul de întârziere Cu toate acestea, nu există nicio garanție că va fi primit un mesaj Chiar și cu un sistem de comunicare fiabil, există întotdeauna șansa ca destinatarul să nu poată primi mesajul din cauza unei eșecuri În transmiterea de mesaje fără blocare, expeditorul poate continua imediat după efectuarea unui apel Singura sarcină a bibliotecii este să spună sistemului de operare să proceseze apelul atunci când are timp Drept urmare, expeditorul nu este blocat deloc Dezavantajul acestei metode este că atunci când expeditorul continuă după operația de trimitere, acesta nu poate utiliza din nou buffer-ul de mesaje, deoarece există posibilitatea ca mesajul să nu fi fost încă trimis Expeditorul trebuie să determine cumva că poate utiliza din nou tamponul De exemplu, puteți interoga sistemul O altă opțiune este de a efectua o întrerupere a sistemului atunci când tamponul este eliberat Cu toate acestea, ambele opțiuni necesită software sofisticat În continuare, ne vom uita la un sistem de mesagerie popular care este utilizat în multe computere multiple Interfață de mesagerie În urmă cu câțiva ani, pachetul PVM (Parallel Virtual Machine) era considerat cel mai popular pachet pentru schimbul de informații între multicomputer [ ] Cu toate acestea, acum a fost aproape universal înlocuit de pachetul MPI (Message-Passing Interface) Pachetul MPI este mult mai complex decât PVM; acceptă mult mai multe apeluri de bibliotecă și mult mai mulți parametri per apel Prima versiune a RMN, numită acum RMN- , a fost completată în de o a doua versiune, RMN- În continuare, vom vorbi pe scurt despre RMN- , iar apoi vom vedea ce este nou în RMN- Consultați Refs [ , ] pentru mai multe informații despre RMN Pachetul MPI- , spre deosebire de PVM, nu are nimic de-a face cu crearea și managementul procesului Procesele trebuie create de utilizator însuși prin apeluri de sistem locale Odată create, procesele sunt organizate în grupuri care nu se schimbă Cu aceste grupuri funcționează RMN RMN se bazează pe patru concepte: comunicatori, tipuri de date transmise, operații de comunicare și topologii virtuale Un comunicator este un grup de procese plus un context Un context este o etichetă care identifică ceva (de exemplu, o fază de execuție) În procesul de trimitere și primire a mesajelor, contextul poate fi folosit pentru a nu confunda mesajele care nu au legătură între ele Tipurile de date transmise în mesaje pot fi diferite, inclusiv caractere, numere întregi scurte, obișnuite și lungi, numere cu virgulă mobilă de precizie standard și dublă etc În plus, se pot construi noi tipuri de date din tipurile de date existente RMN-ul suportă multe operațiuni de comunicare Iată cum arată operația de trimitere a mesajelor: MPI Send( y ep, num elements, data type, destinatar, tag, comunicator) Multicalculatoare În acest apel, conținutul buffer-ului este transmis receptorului, care conține elemente de tip datatype în numărul de elemente-num Câmpul de etichetă este eticheta mesajului; destinatarul poate primi doar mesaje care au această etichetă Ultimul câmp (comunicatorul) arată cărui grup de procese aparține destinatarul (destinatarul este pur și simplu un index în lista de procese dintr-un anumit grup) Un apel similar pentru a primi un mesaj arată astfel: MPI Recv(& y ep, number of elements, data type, sender , te r, comunicator, ^status) Acest apel indică faptul că receptorul așteaptă un mesaj de la expeditorul de tip data type cu eticheta dată RMN-ul acceptă patru moduri de comunicare de bază Primul mod este sincron În ea, expeditorul nu poate începe să transmită date până când receptorul efectuează un apel MPI Recv Al doilea mod este tamponarea În acest mod, limitarea primului mod nu se aplică Al treilea mod este standard Este dependent de implementare, adică poate fi implementat fie modul sincron, fie modul tampon Al patrulea mod este pregătirea Aici, ca și în modul sincron, emițătorul cere ca receptorul să fie disponibil, dar fără verificare Fiecare dintre aceste primitive are versiuni blocante și neblocante pentru un total de primitive Obținerea poate fi doar în două moduri: blocare și neblocare RMN-ul sprijină diverse forme de interacțiune colectivă În orice formă de astfel de interacțiune, toate procesele din grup trebuie să efectueze apelul cu parametri compatibili În caz contrar, apare o eroare De exemplu, într-o formă tipică de interacțiune colectivă, procesele pot fi organizate într-o structură arborescentă, în care datele sunt transferate de la frunze la rădăcini, suferind o anumită prelucrare la fiecare pas (aceasta poate fi o adăugare de valori sau o căutare de maxim) Al patrulea concept de bază al MPI este topologia virtuală a proceselor (arborele, inelul, rețeaua, torul etc ) Această organizare a proceselor oferă posibilitatea denumirii căilor de comunicație și simplifică interacțiunea MPI- a adăugat suport pentru procese dinamice, acces la memorie de la distanță, comunicare colectivă fără blocare, I/O scalabil, procesare în timp real și multe altele Există un "război" în comunitatea științifică de ani de zile între susținătorii MPI și PVM Susținătorii RVM au susținut că sistemul a fost mai ușor de învățat și mai ușor de utilizat Fanii MPI au răspuns spunând că MPI acceptă mai multe funcții și, în plus, acest sistem este standardizat, ceea ce este confirmat de documentul oficial De acord cu aceasta, apărătorii RVM au obiectat că lipsa tuturor documentelor asociate procesului de standardizare birocratică nu este un motiv pentru a abandona sistemul Până la urmă, când totul a fost spus și făcut, victoria a revenit la RMN Planificare Nu este dificil pentru programatorii de sistem MPI să dezvolte sarcini în care solicitările sunt făcute către mai multe procesoare simultan și care sunt efectuate suficient Capitolul Arhitecturi de calculatoare paralele pentru o lungă perioadă de timp Când există mai multe solicitări de la mai mulți utilizatori, fiecare cerere utilizează un număr diferit de procesoare pentru o perioadă diferită de timp Prin urmare, clusterul are nevoie de un planificator care determină când să ruleze fiecare dintre joburi În cel mai simplu model, planificatorul de joburi trebuie doar să știe de câte procesoare trebuie să ruleze fiecare job În acest model, sarcinile sunt aliniate strict în ordinea FIFO (Fig , a) Când începe să se execute primul job, planificatorul verifică dacă există suficiente procesoare pentru a rula următoarea lucrare în ordine Dacă da, atunci începe să ruleze și așa mai departe Dacă nu, atunci sistemul așteaptă până când sunt eliberate suficiente procesoare În exemplul nostru, clusterul conține procesoare, dar ar putea conține în blocuri de bucăți (ar rezulta grupuri de procesoare) sau într-o altă combinație grup de procesoare grup de procesoare grup de procesoare a b Orez Executarea sarcinilor în cluster (procesoarele inactive sunt afișate cu gri): în ordinea FIFO (a); fără a bloca începutul cozii (b); prin completarea unui dreptunghi în procesoare - sistem de coordonate timp (în) Într-un algoritm de programare mai complex, blocarea în capul cozii este evitată În acest caz, toate sarcinile pentru care nu există suficiente procesoare sunt sărite, iar prima sarcină, pentru care există suficiente procesoare, este pusă la execuție Ori de câte ori se termină un job, coada de joburi rămase este verificată în ordinea FIFO (Figura b) Un algoritm și mai complex necesită să se cunoască dinainte de câte procesoare sunt necesare pentru a finaliza fiecare sarcină și cât timp va dura Având aceste informații, planificatorul de sarcini poate încerca să umple dreptunghiul din sistemul de coordonate procesor-timp cu joburi (Fig , c) Acest lucru este eficient în special atunci când sarcinile sunt primite în timpul zilei și trebuie finalizate noaptea În acest caz, planificatorul de sarcini primește toate informațiile necesare în avans și poate executa sarcini în ordinea optimă Multicalculatoare Memoria partajată la nivelul aplicației Exemplele noastre arată că multicalculatoarele se scalează mult mai bine decât multiprocesoarele Acest fapt a dus la apariția sistemelor de mesagerie precum MPI Mulți programatori nu le place acest model și ar prefera să aibă iluzia memoriei partajate chiar dacă nu există cu adevărat Dacă acest obiectiv ar putea fi atins, ar fi excelent din toate punctele de vedere: atât în ceea ce privește echipamentele mai ieftine (cel puțin la nivelul fiecărui nod), cât și în ceea ce privește comoditatea de programare S-ar putea spune că acesta ar fi Sfântul Graal al calculului paralel Mulți cercetători au ajuns la concluzia că memoria comună nu trebuie construită la nivel arhitectural - există și alte moduri Din fig Figura arată că există mai multe niveluri la care poate fi organizată memoria partajată În continuare, vom învăța cum să introducem memoria partajată în modelul software al unui multicomputer dacă nu este suportată de hardware Memoria partajată distribuită O clasă de sisteme cu memorie partajată la nivel de aplicație sunt sistemele cu memorie de paginare Această clasă de sisteme este cunoscută sub acronimul DSM (Distributed Shared Memory) Ideea este simplă: un număr de procesoare dintr-un multicomputer împart un spațiu comun de adrese virtuale de paginare Cea mai simplă opțiune este ca fiecare pagină să fie stocată în memoria RAM a unui singur procesor Pe fig și vedem spațiul total de adrese virtuale, care constă din pagini distribuite între patru procesoare Când procesorul accesează o pagină din memoria RAM locală, citirile și scrierile au loc fără întârziere Dacă procesorul accesează o pagină dintr-o altă memorie RAM, apare o eroare de pagină Cu toate acestea, în loc să caute pagina lipsă pe disc, sistemul de operare trimite un mesaj către nodul în care se află pagina pentru a o prelua din spațiul local de adrese și a o trimite la destinație Când pagina este primită, aceasta este mapată înapoi în memorie, iar comanda suspendată este re-execută, la fel ca o eroare normală de ieşire a paginii În Figura b, vedem situația după ce procesorul a primit o eroare lipsă de la pagina , după care a fost transferat de la procesorul la procesorul Ideea a fost implementată pentru prima dată în mașina Ivy [ ] În el, multicomputerul are o memorie partajată complet funcțională, secvențial consistentă Sunt disponibile diverse opțiuni de optimizare pentru a îmbunătăți performanța Prima optimizare în IVY a fost aceea că paginile de numai citire ar putea fi prezente pe mai multe noduri în același timp În cazul unei erori de pagină lipsă, o copie a paginii este trimisă către mașina solicitantă, dar originalul rămâne pe loc, deoarece nu există pericol de conflicte Pe fig c arată o situație în care două procesoare împărtășesc o pagină comună numai pentru citire, pagina Dar chiar și cu această optimizare este dificil să se obțină o performanță ridicată, mai ales când un proces scrie câteva cuvinte în partea de sus a unei pagini, iar un alt proces pe alt procesor scrie în același timp Capitolul Arhitecturi de calculatoare paralele pune câteva cuvinte în partea de jos a aceleiași pagini Deoarece o singură copie a acestei pagini este permisă să existe, pagina trebuie să fie transferată în mod constant înainte și înapoi Această situație se numește separare imaginară Procesor Procesor Procesor Procesor V Orez Spațiu de adrese virtuale de pagini distribuite între patru noduri multicomputer: stare inițială (a); starea după ce procesorul a accesat pagina (b); stare după ce procesorul a accesat pagina numai în citire (c) Problema separării imaginare poate fi rezolvată în diferite moduri De exemplu, se poate abandona consistența secvențială în favoarea consistenței libere [ ] În cazul consistenței libere, paginile care pot fi scrise pot fi prezente pe mai multe noduri în același timp, dar înainte de a scrie, procesul trebuie să efectueze o operațiune de achiziție pentru a raporta Multicalculatoare despre intentia ta În acest moment, toate, cu excepția ultimei copii, sunt invalidate și nu pot fi făcute copii până la finalizarea operațiunii de eliberare După efectuarea operației de eliberare, pagina devine publică din nou A doua opțiune de optimizare presupune că inițial toate paginile sunt mapate la memorie în modul doar citire Prima dată când este scrisă o pagină, sistemul creează o copie a paginii, numită geamăn Pagina originală este apoi mapată în memorie într-un format de citire/scriere, după care scrierile ulterioare pot fi făcute fără întârziere Dacă apare o eroare de pagină pe gazda la distanță, ceea ce înseamnă că o pagină modificată trebuie trimisă acolo, se efectuează mai întâi o comparație cuvânt cu cuvânt a paginii curente cu omologul său După aceea, doar acele cuvinte care au fost modificate sunt transmise gazdei la distanță, și nu întreaga pagină, ceea ce reduce dimensiunea mesajelor După ce apare o eroare de pagină lipsă, trebuie să determinați unde să o căutați Aici sunt posibile diferite abordări, inclusiv utilizarea directoarelor, ca în mașinile NUMA și COMA Multe dintre soluțiile utilizate în DSM sunt potrivite și pentru mașinile NUMA și COMA, deoarece DSM este o implementare software a unor astfel de mașini, în care fiecare pagină este tratată ca o linie de cache DSM continuă să fie o arenă activă de cercetare De mare interes sunt sistemele CASHMERE [ , ], CRL [ ], Shasta [ ] și Treadmarks [ , ] Linda Sistemele DSM paginate (cum ar fi IVY și Treadmarks) folosesc un manager de memorie pentru a intercepta accesul la paginile lipsă din hardware În timp ce pregătirea și redirecționarea numai a cuvintelor distinse în loc de întreaga pagină are un avantaj de performanță, paginile rămân dificil de partajat, așa că sunt utilizate alte abordări Una dintre aceste abordări este implementată în sistemul Linde, în care procesele de pe diferite mașini au la dispoziție o memorie partajată distribuită înalt structurată [ ] Această memorie este accesată folosind un set minim de primitive care pot fi incluse în limbile existente (de exemplu, în C sau FORTRAN), ca urmare, se formează așa-numitele limbi paralele - în acest caz, acestea sunt C -Linda și FORTRAN-Linda Sistemul Linda se bazează pe conceptul unui spațiu tuplu abstract, care este global în raport cu întregul sistem și este disponibil pentru toate procesele din acest sistem Spațiul tuplu este similar cu memoria globală partajată, doar cu o structură internă specifică Fiecare dintre tuplurile din spațiul de tuplu este format din unul sau mai multe câmpuri În C-Linda, câmpurile pot conține numere întregi, întregi lungi și flotanți, precum și tipuri de date complexe, cum ar fi matrice (inclusiv șiruri de caractere) și structuri c (dar nu și alte tupluri) Lista Sunt date exemple de tupluri Capitolul Arhitecturi de calculatoare paralele Lista Tupluri în Linda ("abc" , ) ("matricea- ", , , ) ("fanrily" "is si ster", Carolyn, EH nor) Puteți efectua operații pe tupluri Primul, afară, introduce un tuplu în spațiul tuplurilor De exemplu: outCabc" ); Această operație introduce un tuplu ("abc", , ) în spațiul tuplu Câmpurile unei operațiuni out conțin de obicei constante, variabile sau expresii, cum ar fi: outCmatrix-l", , j, , ); Această operație introduce un tuplu cu patru câmpuri în spațiul tuplu, al doilea și al treilea câmp fiind determinate de valorile curente ale variabilelor i și j A doua operație, ip, extrage un tuplu din spațiul tuplurilor Tuplurile sunt referite după conținut, nu după nume sau adresă Câmpurile operației ip pot conține expresii sau parametri formali De exemplu: InC'abc", , ? ); Această operație scanează spațiul tuplurilor căutând un tuplu format din șirul de caractere "abc", întregul și un al treilea câmp care poate conține orice număr întreg (presupunând că i este un număr întreg) Tuplul găsit este extras din spațiul tuplu, iar variabilei i i se atribuie valoarea celui de-al treilea câmp Potrivirea și extracția sunt operații atomice Deci, atunci când două procese efectuează aceeași operație ip în același timp și nu mai există tupluri care se potrivesc în spațiul de tuplu, doar una dintre operații reușește Un spațiu de tuplu poate conține mai multe copii ale unui singur tuplu Algoritmul de potrivire utilizat în operațiunea ip este destul de simplu Câmpurile operației ip, numite șablon, sunt comparate cu câmpurile corespunzătoare fiecărui tuplu din spațiul tuplu O potrivire are loc dacă sunt îndeplinite următoarele trei condiții: șablon și tuplu au același număr de câmpuri; tipuri de câmpuri corespunzătoare sunt aceleași; fiecare constantă sau variabilă din șablon se potrivește cu câmpul corespunzător din tuplu Parametrii formali indicați printr-un semn de întrebare urmat de un nume de variabilă sau de tip nu participă la căutarea unei potriviri (cu excepția verificării tipului), deși acelor parametri care conțin un nume de variabilă li se atribuie valori după ce este găsită o potrivire Dacă nu se găsește niciun tuplu care se potrivește, procesul este suspendat până când un alt proces a introdus tuplu-ul dorit în spațiul tuplu În acest moment, procesul de apelare se reia automat și detectează un nou tuplu Procesele sunt blocate și eliberate automat, conform Multicalculatoare prin urmare, dacă un proces este gata să scoată un tuplu și altul să introducă, nu contează care proces vine primul A treia operație, citită, este similară cu ip, cu excepția faptului că nu elimină tuplu din spațiul tuplu A patra operație, еѵаі, construiește un nou tuplu pe baza parametrilor săi, care este copiat în spațiul tuplu Acest mecanism poate fi folosit pentru a efectua orice calcule Acesta este modul în care procesele paralele sunt create în sistemul Linda Principala paradigmă de programare a Lindei este modelul de lucrător replicat Modelul se bazează pe conceptul unui sac de sarcini care trebuie completat Procesul principal începe cu execuția unei bucle care conține operația out("sacul de sarcini", job); La fiecare iterație a buclei, una dintre sarcini este introdusă în spațiul tuplurilor Fiecare flux de lucru începe prin primirea unui tuplu care descrie jobul: in("sacul de sarcini", ?job); Procesul efectuează apoi această sarcină La finalizarea sarcinii, el primește următoarele În plus, un nou job poate fi inclus în pachetul de joburi în timpul execuției Astfel, munca este distribuită dinamic între procesele de lucru, iar fiecare proces de lucru este ocupat în mod constant Există diverse implementări ale Linda în sisteme multicomputer În toate implementările, întrebarea cheie este cum să distribuiți tuplurile pe mașini și cum să le găsiți dacă este necesar Opțiunile sunt difuzare și directoare Replicarea este, de asemenea, o problemă importantă Consultați [ ] pentru mai multe detalii Ogsa O abordare ușor diferită a implementării memoriei partajate într-un multicomputer la nivel de aplicație este utilizarea nu tuplelor pentru partajarea obiectelor cu drepturi depline După cum știți, obiectele constau dintr-o stare internă (ascunsă) și metode pentru operații cu această stare Deoarece programatorul nu are acces direct la stare, este posibil să partajeze resurse între mașini care nu partajează memoria fizică Unul dintre sistemele în care este implementată această abordare se numește Orca [ , , ] Orca este un limbaj de programare tradițional (bazat pe limbajul Modula ) care are două caracteristici noi - suport pentru obiecte și capacitatea de a crea noi procese Un obiect din Orca este un tip de date abstract, similar cu un obiect din Java sau cu un pachet din Ada Un obiect încapsulează structuri de date interne și metode de utilizator, care sunt numite operații Obiectele sunt pasive, adică nu conțin fire de execuție de program către care să poată fi trimise mesaje Procesele accesează datele interne ale unui obiect apelând metodele acestuia Fiecare metodă din Orca constă dintr-o listă de perechi de instrucțiuni bloc de siguranță Un fuzibil este o expresie booleană care poate lua Capitolul Arhitecturi de calculatoare paralele valoarea este adevărată (adevărată) sau falsă (falsă) Când este apelată o operațiune, toți paznicii ei sunt evaluați în nicio ordine anume Dacă toate sunt false, procesul de apelare este suspendat până când unul dintre ele este adevărat Când se găsește o astfel de siguranță, se execută blocul de instrucțiuni care urmează Lista arată un obiect de stivă cu două operații, push și pop Lista Obiect de stivă simplificat cu date interne și două operații stiva de implementare a obiectelor; sus:întreg; # stocare stivă stivă:matrice[întreg ,nl]de întreg; operațiune pushdtem: întreg); # o funcție care nu returnează nimic începe stackLtop] := element; sus := sus + ; Sfârşit; # împinge elementul pe stivă # incrementează indicatorul stivei operațiune pop(): întreg; start guard top> do top := top - ; return stackLtop]; od; Sfârşit; # o funcție care returnează un număr întreg # se întrerupe dacă stiva este goală # reduce indicatorul stivei # returnează partea de sus a stivei ÎNCEPE sus:= ; # inițializare Sfârşit; După definirea obiectului stivă, puteți declara variabile de acest tip: s, t, stivă; Această notație creează două obiecte stive și setează variabila vârf în fiecare obiect la Variabila întreagă k poate fi împinsă în stiva s folosind instrucțiunea s$push(k); Operația pop conține o gardă, așa că încercarea de a scoate o variabilă dintr-o stivă goală va determina suspendarea procesului de apel până când un alt proces împinge ceva în stivă Orca are un operator pentru generarea unui nou proces, operatorul furk Noul proces începe procedura specificată în instrucțiunea fork Alți parametri pot fi transferați noului proces, inclusiv un obiect Acesta este modul în care obiectele sunt distribuite mașinilor De exemplu: for i in l n do fork foobar(s) on i; od; Această declarație generează un nou proces pe toate mașinile de la la n, rulând programul foobar pe fiecare Deoarece aceste n procese noi (precum și procesul inițial) rulează în paralel, toate pot împinge elemente în stiva comună și pot pop elemente din stiva comună ca și cum toate ar rula pe un multiprocesor cu memorie partajată Multicalculatoare Operațiile pe obiecte partajate sunt atomice și consecvențial Adică, sistemul garantează că, dacă mai multe procese efectuează operațiuni cu un singur obiect aproape simultan, sistemul însuși stabilește o anumită secvență de evenimente pe care toate procesele le percep În Orca, datele partajate și sincronizarea sunt implementate diferit decât în sistemele de paginare Sunt necesare două tipuri de sincronizare în programele paralele Prima este excluderea reciprocă Excluderea reciprocă împiedică două procese să execute aceeași secțiune critică de cod în același timp În Orca, fiecare operație pe un obiect partajat este ca și cum ar fi executarea unei secțiuni critice, deoarece sistemul garantează că rezultatul final va fi același ca și cum toate secțiunile critice ale codului ar fi executate pe rând În acest sens, un obiect din Ogsa este similar cu un monitor distribuit [ ] Al doilea tip de sincronizare este sincronizarea condiționată, în care un proces se blochează în așteptarea îndeplinirii unei anumite condiții În Ogsa, sincronizarea condiționată se realizează folosind siguranțe În exemplul din Listarea , un proces care încearcă să scoată un element dintr-o stivă goală blochează până când există elemente pe stivă Orca acceptă replicarea obiectelor, migrarea și consistența obiectelor, precum și invocarea operațiunilor asupra acestora Fiecare obiect poate fi într-una din două stări: poate fi unic sau replicat În primul caz, obiectul există doar pe o singură mașină, așa că toate cererile sunt trimise acolo Obiectul replicat este prezent pe toate mașinile care rulează un proces care utilizează obiectul Acest lucru simplifică operația de citire (pentru că se poate face local), dar complică actualizarea Când se efectuează o operație care modifică un obiect replicat, numărul secvenței procesului trebuie mai întâi obținut de la procesul central Apoi, fiecărei mașini este trimis un mesaj care conține o copie a obiectului pentru a efectua operația specificată Deoarece toate aceste actualizări sunt numerotate în ordine, fiecare mașină efectuează pur și simplu operațiunile în ordinea specificată, ceea ce garantează consistența secvențială Glob Cele mai multe sisteme de memorie partajată distribuite, cum ar fi Linda și Ogsa, funcționează în aceeași clădire sau campus Cu toate acestea, este, de asemenea, posibil să se construiască un multicomputer global (la nivel mondial) cu memorie partajată la nivel de aplicație De exemplu, în sistemul Globe, un obiect poate locui simultan în spațiul de adresă al multor procese, eventual rulând pe continente diferite [ , , ] Pentru a accesa datele unui obiect partajat, procesele utilizatorului trebuie să acționeze prin metodele sale, astfel încât diferite implementări sunt acceptabile pentru diferite obiecte De exemplu, este posibil să aveți o copie a datelor care este solicitată după cum este necesar (acest lucru este util pentru datele actualizate frecvent cu un singur proprietar) O altă opțiune este să stocați toate datele în fiecare copie a obiectului și să trimiteți mesaje de actualizare la fiecare copie printr-un protocol multicast securizat Capitolul Arhitecturi de calculatoare paralele Scopul ambițios al sistemului Globe este să ajungă la scara unui miliard de utilizatori și a unui trilion de obiecte (poate mobile) Sarcinile cheie sunt plasarea obiectelor, gestionarea acestora, precum și extinderea sistemului Globe rezolvă aceste probleme menținând doar o structură comună în care fiecare obiect poate avea propriile strategii de replicare, protecție etc Acest lucru evită multe dintre problemele altor sisteme, lăsând doar mecanismul utilizării memoriei partajate pentru programare Alte sisteme distribuite la scară largă includ Globus [ , ] și Legion [ , ], dar acestea, spre deosebire de Globe, nu suportă iluzia memoriei partajate Performanţă Scopul unui computer paralel este de a-l face mai rapid decât o mașină cu un singur procesor Dacă acest obiectiv nu este atins, nu are rost să dezvoltam un computer paralel În plus, acest obiectiv ar trebui atins la un cost minim O mașină care rulează de două ori mai repede decât un singur procesor, dar costă de de ori mai mult decât acesta din urmă este puțin probabil să fie la cerere În această subsecțiune, luăm în considerare câteva aspecte ale performanței arhitecturilor de computere paralele Valori hardware Din punct de vedere hardware, viteza procesoarelor, a dispozitivelor I/O și a rețelei de comunicații este de cel mai mare interes Deoarece viteza procesoarelor și a dispozitivelor de intrare-ieșire este aceeași ca la o mașină cu un singur procesor, parametrii rețelei de comunicații sunt cheie într-un sistem paralel Există două valori cheie aici: latența și debitul Le vom lua în considerare pe rând Latența totală, sau timpul de răspuns, este timpul necesar procesorului pentru a trimite un pachet și a primi un răspuns Dacă pachetul este trimis în memorie, atunci latența este timpul necesar pentru a citi și scrie un cuvânt sau un bloc de cuvinte Dacă un pachet este trimis către un alt procesor, atunci latența este timpul necesar pentru a transfera pachete de o anumită dimensiune între procesoare De obicei, latența pentru pachetele de cea mai mică dimensiune (de obicei un cuvânt sau o linie de cache mică) este de interes Cantitatea de latență este determinată de mai mulți factori, iar această dată este diferită pentru tehnologiile de comutare de circuite, comutare cu stocare și redirecționare, rutare virtuală end-to-end În cazul comutării circuitului, latența este suma timpului de configurare a conexiunii și a timpului de transmisie Pentru a stabili o conexiune, este trimis un pachet de probă care vă permite să rezervați resursele necesare, este returnat un mesaj cu un raport După aceea, puteți asambla pachetul de date Când un pachet este gata, biții pot fi transmiși la viteza maximă, deci dacă timpul total de configurare a conexiunii este Ts, dimensiunea pachetului este de p biți și debitul este de b biți/s, latența unidirecțională este Ts + p /b Multicalculatoare Dacă schema este full duplex și nu este necesară nicio conexiune pentru un răspuns, latența minimă pentru transmiterea unui pachet p-bit și primirea unui răspuns p-bit este Ts + p/b secunde Când schimbați pachetele, nu este necesar să trimiteți un pachet de probă destinatarului în avans, dar este nevoie de ceva timp pentru a asambla pachetul Aici, timpul de transmisie unidirecțională este Ta + p/b, dar în această perioadă pachetul ajunge doar la primul comutator Trecerea prin comutator în sine are ca rezultat o oarecare întârziere, Td, apoi trece la următorul comutator și așa mai departe Timpul Td constă în timpul de procesare și întârzierea în coadă (când trebuie să așteptați până când portul de ieșire devine liber) Dacă există n comutatoare, atunci timpul total de întârziere într-un singur sens este Ta + n(p/b + Td) + p/b, unde ultimul termen reflectă faptul că pachetul a fost transmis de la ultimul comutator la destinatar Latența unidirecțională pentru rutarea virtuală end-to-end se apropie în cel mai bun caz de Ta + p/b, deoarece nu există pachete de sondă pentru a stabili o conexiune și nicio întârziere de stocare și redirecționare În esență, acesta este timpul de asamblare a pachetului plus timpul de transmisie a biților Ar fi necesar să adăugați întârzierea de propagare a semnalului, dar în toate cazurile este mică Următoarea măsurătoare hardware este debitul Multe programe paralele, în special în științele naturii, sunt orientate spre mutarea unor cantități uriașe de date, astfel încât numărul de octeți pe care un sistem poate transfera pe secundă este o măsură foarte importantă a performanței Există mai multe valori de debit Am luat în considerare deja unul dintre ele - debitul secțiunii (a se vedea subsecțiunea "Rețele de comunicații" din secțiunea "Multicomputere") O altă măsurătoare, debitul agregat, este calculată prin însumarea debitului tuturor legăturilor Acest număr indică numărul maxim de biți care pot fi transmiși la un moment dat O altă măsură importantă este debitul mediu al fiecărui procesor Dacă fiecare procesor poate produce date doar la o viteză de MB/s, atunci o rețea cu o lățime de bandă transversală de GB/s este de puțin folos Viteza de interacțiune în acest caz este limitată de capacitățile de viteză ale fiecărui procesor În practică, este foarte dificil să se abordeze debitul posibil teoretic Motivele pentru aceasta pot fi foarte diferite De exemplu, fiecare pachet conține întotdeauna date de service legate de asamblare, crearea antetului, trimitere Când trimitem de pachete de octeți fiecare, nu vom atinge niciodată același debit ca atunci când trimitem un pachet de de octeți Cu toate acestea, pentru a reduce latența, este mai bine să folosiți pachete mici, deoarece pachetele mari blochează liniile și comută mult timp Ca rezultat, există un conflict între modul de a obține o latență scăzută și un randament ridicat Pentru unele aplicații, latența este mai importantă, pentru altele, debitul este mai important Dar, în orice caz, este important să înțelegem că debitul poate fi întotdeauna crescut în detrimentul costurilor suplimentare cu materiale (prin adăugarea Capitolul Arhitecturi de calculatoare paralele mai multe fire sau prin instalarea de fire mai late), dar în ceea ce privește reducerea timpului de întârziere, injecțiile financiare nu vor ajuta aici Prin urmare, de obicei, este mai bine să aveți grijă de latența minimă de la bun început și abia apoi să vă gândiți la debit Valorile programului Valorile hardware, cum ar fi latența și debitul, arată de ce este capabil hardware-ul Dar utilizatorii sunt interesați de ceva complet diferit Vor să știe cu cât de repede vor rula programele lor pe un computer paralel în comparație cu un singur procesor Pentru ei, metrica cheie este accelerarea: cu cât de repede rulează un program pe un sistem cu n procesoare în comparație cu un sistem cu un singur procesor Rezultatele sunt de obicei ilustrate grafic (Fig ) Problemă de modelare N-corpuri Avari Inversarea matricei de profil Orez În practică, programele nu pot atinge accelerarea ideală (indicată prin linie punctată) Aici vedem mai multe programe paralele diferite care rulează pe un multicomputer format din de procesoare Pentium Pro Fiecare curbă arată accelerarea unui program cu k procesoare în funcție de k Linia punctată reprezintă accelerarea ideală în care utilizarea k procesoare face ca programul să ruleze de k ori mai rapid pentru orice k Puține programe ating viteza ideală, deși există destul de multe programe care se apropie de ideal Problema modelării N corpuri datorită paralelismului se rezolvă mult mai repede, Avari Multicalculatoare (jocul african) se calculează, de asemenea, mai rapid, dar este imposibil să grăbim inversarea unei anumite matrice de profil de mai mult de cinci ori, indiferent de câte procesoare folosim Programele și rezultatele sunt discutate în [ ] Există o serie de motive pentru care este aproape imposibil să se obțină o accelerare perfectă: în aproape toate programele există fragmente care sunt executate în mod fundamental secvențial, de exemplu, inițializarea, citirea datelor inițiale sau obținerea de rezultate Creșterea numărului de procesoare nu va ajuta aici Să presupunem că un program rulează pe un computer cu un singur procesor timp de T secunde, cu o fracțiune (/) din acel timp rulând secvențial și o fracțiune ( -/) executând potențial în paralel, așa cum se arată în Fig a Dacă codul paralel poate fi rulat pe n procesoare, atunci timpul de execuție al acestui cod se va reduce cel mai bine de la ( - f)T la ( - f)T/n, așa cum se arată în Fig b Ca urmare, timpul total de execuție a programului (atât codul serial, cât și codul paralel) va fi fT + ( - f)T/n Accelerația este timpul de execuție al programului original (T) împărțit la acest nou timp: Accelerație = - + - )/ Pentru / = putem obține o accelerare liniară, dar pentru / > accelerația ideală nu este realizabilă deoarece programul are o parte în serie Acest fenomen se numește Legea lui Amdahl O piesă care poate fi în principiu serializată O piesă poate fi executată în paralel n de lucru b T Orez Pe lângă partea de serie, programul conține și partea care poate fi executată în paralel (a); rezultat al prelucrării paralele a unei părți a programului (b) Legea lui Amdahl este doar unul dintre motivele pentru care accelerația perfectă este de neatins Un anumit rol în acest sens îl joacă timpul de întârziere în liniile de comunicație și lățimea de bandă limitată și deficiențele algoritmilor Chiar dacă am avea de procesoare, nu toate programele ar putea fi scrise pentru a le folosi pe toate, iar suprasarcina de a rula atât de multe procesoare ar putea fi destul de semnificativă Mai mult, mulți algoritmi cunoscuți aproape că nu sunt susceptibili de procesare paralelă, așa că trebuie înlocuiți cu algoritmi cvasi-optimi În același timp, pentru mulți fund Capitolul Arhitecturi de calculatoare paralele Pentru multe sarcini, ar fi foarte de dorit ca programul să ruleze de n ori mai rapid, chiar dacă necesită n procesoare La urma urmei, procesoarele nu sunt chiar atât de scumpe Tehnici de performanță Cea mai evidentă modalitate de a îmbunătăți performanța sistemului este să adăugați procesoare Cu toate acestea, trebuie să adăugați procesoare astfel încât blocajele să nu apară în sistem Sistemul, după adăugarea procesoarelor la care există o creștere corespunzătoare a performanței, se numește scalabil Luați în considerare procesoare conectate printr-o magistrală comună (Fig , a) Imaginați-vă că am extins sistemul la procesoare adăugând încă (Figura b) Dacă lățimea de bandă a magistralei este de b MB/s, atunci prin multiplicarea de patru ori a numărului de procesoare, vom reduce lățimea de bandă disponibilă fiecărui procesor de la / la / MB/s Un astfel de sistem nu poate fi numit scalabil CPU □ E R ? ? ■yjj yjschsh r E r [ ]-C ] E -C ] E ] □ s-T L ШІІШ J b d JLJ Е j □ a B C D Orez Un sistem de procesoare conectate printr-o magistrală comună (a); un sistem de procesoare conectate printr-o magistrală comună (b); grila de comunicatii de procesoare (a); matrice de comunicații de procesoare (d) Și acum să facem același lucru cu grila de comunicații (Fig , c și d) Într-o astfel de topologie, adăugarea de noi procesoare înseamnă adăugarea de noi legături de comunicație, astfel încât atunci când sistemul se scalează, debitul total al fiecărui procesor nu scade, așa cum este cazul magistralei De fapt, raportul link-to-procesor crește de la cu procesoare ( link-uri) la cu procesoare ( link-uri), astfel încât pe măsură ce se adaugă mai multe procesoare, debitul total al fiecărui procesor crește Desigur, debitul nu este singurul parametru Adăugarea procesoarelor la magistrală nu crește diametrul rețelei sau latența, în timp ce adăugarea procesoarelor la rețea o face Diametrul unei rețele n x n este (n - ), deci în cel mai rău caz, latența crește aproximativ ca rădăcină pătrată a numărului de procesoare Pentru de procesoare, diametrul este de , pentru de procesoare este de , deci dacă multiplicați de patru ori numărul de procesoare, atunci diametrul și, în consecință, latența medie, se va dubla aproximativ În mod ideal, un sistem scalabil ar trebui să păstreze același debit mediu per procesor și o latență medie constantă atunci când adaugă procesoare noi În practică, conservarea Multicalculatoare este fezabil un debit suficient al fiecărui procesor, dar latența crește odată cu creșterea numărului de procesoare Cel mai bine ar fi să-l faci să crească logaritmic, ca într-un hipercub Ideea este că latența este adesea fatală pentru performanța aplicațiilor mici și mijlocii Dacă un program are nevoie de date care nu se află în memoria locală, este nevoie de o perioadă semnificativă de timp pentru a-l obține și, cu cât sistemul este mai mare, cu atât este mai mare întârzierea Această problemă este comună atât pentru multiprocesoare, cât și pentru multicalculatoare, deoarece ambele arhitecturi împart memoria fizică în module fixe, distribuite Există mai multe tehnici folosite de dezvoltatorii de sisteme pentru a reduce sau cel puțin a masca latența Prima tehnologie este replicarea Dacă replicile unui bloc de date pot fi stocate în mai multe locații, atunci viteza de acces la aceste date poate fi mărită O posibilă opțiune este utilizarea unui cache, în care una sau mai multe copii ale blocurilor de date sunt stocate lângă un loc unde ar putea fi necesare și căruia îi "aparțin" O altă opțiune este de a stoca mai multe copii peer-to-peer (spre deosebire de relația inegală master-slave a memoriei principale și a memoriei cache) Când sunt păstrate mai multe copii, întrebările principale sunt de către cine, când și unde sunt plasate Aici, sunt posibile o varietate de opțiuni, de la alocarea dinamică bazată pe hardware a datelor la cerere până la plasarea lor forțată în timpul încărcării folosind directivele compilatorului corespunzătoare În orice caz, sarcina controlului coordonat vine în prim plan A doua tehnică este mascarea latenței prin ceea ce este cunoscut sub numele de preîncărcare, în care un articol este apelat înainte de a fi necesar Acest lucru permite ca procesul de apelare și procesul de execuție să se suprapună, deoarece programul primește fără întârziere elementul solicitat Preluarea poate fi implementată atât în hardware cât și în software În cazul preluării, nu numai cuvântul dorit este încărcat în cache, ci întreaga linie cache care îl conține, în așteptarea că alte cuvinte din această linie vor fi utile în viitor Preîncărcarea poate fi, de asemenea, controlată direct Când compilatorul află că programul va avea nevoie de anumite date în timpul execuției, introduce o comandă pentru a le introduce în cod și în așa fel încât să obțină datele necesare la timp O astfel de strategie presupune ca compilatorul să aibă cunoștințe complete despre mașină și mecanismul său de sincronizare și să controleze unde sunt stocate toate datele Comenzile speculative LOAD funcționează cel mai bine atunci când este absolut sigur că datele încărcate vor fi utilizate O eroare de ieșire a paginii la executarea unei comenzi LOAD pe o ramură care nu va fi niciodată necesară este extrem de costisitoare A treia tehnică de mascare a latenței este utilizarea mai multor fire de execuție a programului Dacă comutarea între procese poate fi suficient de rapidă (de exemplu, oferindu-le fiecăruia propria hartă de memorie și propriile registre), atunci când un fir blochează așteptarea datelor, hardware-ul poate comuta rapid la un alt fir gata de executare În cazul limitativ, procesorul execută Capitolul Arhitecturi de calculatoare paralele prima instrucțiune din firul , a doua instrucțiune din threadul și așa mai departe Astfel, procesorul este mereu ocupat, chiar și cu întârzieri mari pe fire individuale A patra tehnică de mascare a latenței este utilizarea scrierilor neblocante De obicei, la executarea unei instrucțiuni STORE, procesorul așteaptă finalizarea acesteia și abia apoi continuă să funcționeze Dacă există intrări neblocante, programul continuă să ruleze chiar și atunci când o operație de memorie este în curs Este mai dificil să continui programul în timp ce se execută comanda LOAD, dar chiar și acest lucru este posibil datorită execuției cu o schimbare a secvenței Calcul distribuit Multe dintre sarcinile de astăzi în știință, tehnologie, producție, protecția mediului și alte domenii sunt la scară foarte mare și cu multiple fațete Pentru a le rezolva, este necesar să combinați cunoștințele, abilitățile, instrumentele, capacitățile, programele și datele multor organizații, adesea împrăștiate în întreaga lume Iată doar câteva exemple: ♦ oameni de știință care studiază toate aspectele unei misiuni pe Marte; ♦ un consorțiu care dezvoltă un produs complex (ex o aeronavă sau un baraj); ♦ o echipă internațională de salvare care își coordonează acțiunile în timpul unui dezastru natural Unele sarcini necesită mai multă cooperare pe termen lung, altele mai puțin, dar toate au un detaliu comun Diferite organizații lucrează împreună pentru a atinge un obiectiv comun, fiecare folosind propriile sale resurse și propriile sale proceduri de operare Până nu demult era foarte dificil să se asigure colaborarea diferitelor organizații care folosesc sisteme de operare diferite, baze de date și protocoale diferite Cu toate acestea, nevoia tot mai mare de colaborare la scară largă între organizații a condus la dezvoltarea de sisteme și tehnologii pentru combinarea calculatoarelor disparate în ceea ce se numește grid computing Într-un anumit sens, calculul distribuit este următorul pas de-a lungul axei din Fig Un sistem de calcul distribuit poate fi privit ca un cluster eterogen foarte mare, internațional, slab cuplat Scopul sistemului de calcul distribuit este de a crea o infrastructură tehnică care să permită mai multor organizații care urmăresc un obiectiv comun să creeze o singură organizație virtuală Această organizație virtuală ar trebui să fie o structură flexibilă cu un număr de membri în schimbare dinamică, în care membrii individuali să poată lucra împreună în zonele necesare și, în același timp, să își controleze pe deplin propriile resurse Serviciile, instrumentele și protocoalele sunt dezvoltate de cercetători în acest scop și acesta este ceea ce permite membrilor individuali să funcționeze într-o organizație virtuală Un sistem de calcul distribuit este în mod inerent multidimensional, cu un număr mare de egali Se poate opune Calcul distribuit modele de calcul tradiționale În modelul client-server, doi participanți sunt implicați într-o tranzacție - un server care oferă un anumit serviciu și un client care dorește să-l primească Un exemplu tipic este World Wide Web, unde mulți utilizatori accesează servere pentru informații Sistemele de calcul distribuite diferă, de asemenea, de aplicațiile punct la punct care combină perechi de mașini pentru a schimba fișiere între ele Un exemplu tipic de aplicație punct la punct este e-mailul Ca o consecință a acestor diferențe, sunt necesare noi protocoale și noi tehnologii Într-un sistem de calcul distribuit, este necesar să se ofere acces la o varietate de resurse Fiecare resursă are propriul său sistem și o organizație care o deține, care decide cât de mult din resursă este disponibilă, la ce oră și cui Fără a intra în detalii, putem spune că esența unui sistem de calcul distribuit este în gestionarea accesului la resurse Una dintre opțiunile de modelare a unui sistem de calcul distribuit este reprezentarea acestuia ca o structură ierarhică cu mai multe niveluri (Tabelul ) Nivelul inferior este nivelul infrastructurii care combină componentele din care este construit sistemul de calcul distribuit Pe partea hardware, acestea includ procesoare, discuri, rețele și senzori; pe partea software, programe și date Acestea sunt resursele fizice accesate de sistemul de calcul distribuit Tabelul Nivelurile ierarhice ale unui sistem de calcul distribuit Descrierea nivelului Stratul de aplicație Aplicații care partajează și utilizează în mod coerent resurse Nivel de echipă Cercetare, mediere, monitorizare, management al grupurilor de resurse Stratul de resurse Stratul de infrastructură Securitatea și controlul accesului la resurse individuale Resurse fizice, inclusiv computere, stocare pe disc, rețele, senzori, software și date Următorul nivel în sus în ierarhie este nivelul resurselor Acest nivel este responsabil pentru gestionarea resurselor individuale Adesea, o resursă inclusă într-un sistem de calcul distribuit este asociată cu un proces local care gestionează resursa și oferă acces controlat la aceasta pentru utilizatori la distanță Scopul acestui strat este de a oferi straturilor superioare o interfață uniformă prin care acestea să se poată întreba despre caracteristicile resurselor individuale, să le monitorizeze și să le folosească în siguranță Chiar mai sus este nivelul echipei, care operează pe grupuri de resurse Una dintre funcțiile sale este de a explora sistemul de calcul distribuit, identificând locația resurselor Datorită acestor studii, utilizatorul poate găsi ciclurile de procesor necesare, spațiul pe disc sau date specifice Nivelul de echipă poate menține cataloage și alte baze de date pentru a furniza informațiile necesare În plus, poate efectua operațiuni intermediare, reunind furnizori și utilizatori Capitolul Arhitecturi de calculatoare paralele furnizorii de diverse servicii și, poate, de asemenea, prin alocarea de resurse limitate între utilizatorii concurenți Nivelul de echipă este, de asemenea, responsabil pentru propagarea datelor, includerea de noi participanți și resurse în sistemul de calcul distribuit, contabilitatea și întreținerea bazelor de date cu politicile de acces care descriu ce utilizator are acces la ce resurse În partea de sus a ierarhiei se află stratul de aplicație Aplicațiile utilizator funcționează la acest nivel Stratul de aplicație se referă la straturile inferioare pentru a obține drepturi de utilizare a anumitor resurse, trimite cereri pentru utilizarea acestora, monitorizează progresul solicitărilor, gestionează eșecurile, anunță utilizatorul despre rezultate Cheia succesului unui sistem de calcul distribuit este securitatea Proprietarii insistă aproape întotdeauna asupra dreptului la control deplin asupra resurselor lor, cu o monitorizare cuprinzătoare (cine, cât timp și cât de mult le folosesc) Fără un sistem de securitate bun, nicio organizație nu și-ar oferi resursele pentru calcularea distribuită Cu toate acestea, dacă utilizatorul ar trebui să-și introducă numele de utilizator și parola pe fiecare computer implicat în calculul distribuit de care avea nevoie, munca utilizatorului ar deveni prea oneroasă Prin urmare, ar trebui dezvoltat un model de securitate care să ia în considerare aceste considerații Capacitatea de conectare unică este una dintre caracteristicile cheie ale modelului de securitate Primul pas în utilizarea unui sistem de calcul distribuit este înregistrarea și obținerea unui certificat, adică a unui document cu semnătură digitală care indică în interesul cui trebuie efectuată lucrarea Certificatul poate fi delegat, astfel încât, dacă în procesul de calcul sunt necesare unele calcule auxiliare, cu acesta pot fi identificate și procese copil Când un certificat de acces este prezentat unui sistem de la distanță, acesta trebuie mapat la mecanismul său de securitate local De exemplu, UNIX identifică utilizatorii cu identificatori pe biți, dar alte sisteme pot folosi scheme diferite În cele din urmă, este necesar un mecanism prin care politicile de acces să fie stabilite, menținute și actualizate Pentru a susține interacțiunea între diverse organizații și mașini, sunt necesare standarde atât pentru serviciile furnizate, cât și pentru protocoalele de accesare a acestora Pentru a gestiona procesul de standardizare, comunitatea de calcul distribuit a creat o organizație numită Global Grid Forum Rezultatul muncii ei a fost un șablon pentru formarea și dezvoltarea diferitelor standarde, numite OGSA (Open Grid Services Architecture - o arhitectură deschisă pentru servicii de calcul distribuite) Standardele dezvoltate se bazează pe cele existente ori de câte ori este posibil, de exemplu, WSDL (Web Services Definition Language) este folosit pentru a descrie serviciile OGSA Serviciile standardizate în prezent se încadrează în una dintre cele opt categorii, deși această listă va fi, fără îndoială, extinsă în viitor Servicii de infrastructură (oferă interacțiune între resurse) Servicii de management al resurselor (rezervarea și eliberarea resurselor) Servicii de date (copierea și mutarea datelor acolo unde este nevoie) Rezumatul capitolului Servicii de context (descrierea resurselor și politicilor necesare pentru utilizarea acestora) Servicii de informare (obținerea de informații despre disponibilitatea unei resurse) Servicii de autocontrol (menținerea calității declarate a serviciului) Servicii de protecție (aplicarea politicilor de securitate) Servicii de control al execuției (controlul fluxului de sarcini) Se pot spune mult mai multe despre sistemele de calcul distribuite, dar volumul cărții nu ne permite să aprofundăm mai mult în acest subiect Informații suplimentare despre aceste sisteme pot fi găsite în [ , , ] Rezumatul capitolului Devine din ce în ce mai dificil să se realizeze o creștere a performanței computerului pur și simplu prin creșterea frecvenței de ceas, pe măsură ce apare problema eliminării căldurii Prin urmare, dezvoltatorii și-au îndreptat atenția către paralelism ca mijloc de a accelera calculele Paralelismul poate fi introdus la diferite niveluri, atât la cel mai de jos, unde elementele sunt foarte rigid legate între ele, cât și la vârf, unde legăturile sunt foarte slabe Nivelul inferior este paralelismul intra-procesor, când acțiunile paralele sunt efectuate pe baza unui singur cip O formă de paralelism intra-procesor este paralelismul la nivel de instrucțiune; în acest caz, o comandă sau o secvență de comenzi este împărțită în micro-operații care pot fi executate în paralel de diferite blocuri funcționale A doua formă de paralelism intraprocesor este multithreading; în acest caz, procesorul poate alterna între mai multe fire de execuție de program Rezultatul este un multiprocesor virtual A treia formă de paralelism intraprocesor este multiprocesorul cu un singur cip Într-un multiprocesor cu un singur cip, două sau mai multe nuclee sunt plasate pe același cip, ceea ce le permite să funcționeze simultan Următorul nivel în sus în ierarhie sunt coprocesoarele De obicei, coprocesorul este implementat ca o placă încorporată, ceea ce vă permite să creșteți capacitățile de procesare ale procesorului în unele zone speciale, cum ar fi întreținerea protocolului de rețea sau procesarea datelor multimedia Aceste procesoare suplimentare reduc sarcina procesorului principal, lăsându-l liber să facă alte lucruri în timp ce rezolvă sarcini foarte specializate Cu un nivel mai sus sunt multiprocesoarele cu memorie partajată Astfel de sisteme conțin două sau mai multe procesoare complete care partajează o memorie comună Multiprocesoarele cu acces uniform la memorie (mașini UMA) pot comunica printr-o magistrală comună (magistrală de urmărire) sau printr-o rețea de comutare încrucișată sau în mai multe etape Se caracterizează printr-un timp de acces unificat la orice module de memorie În schimb, în multiprocesoarele NUMA, tuturor proceselor li se oferă, de asemenea, un spațiu de adrese comun, dar timpul de acces la modulele de la distanță este vizibil mai lung decât la cele locale În cele din urmă, în multiprocesoarele SOMA, liniile Capitolul Arhitecturi de calculatoare paralele Cache-urile sunt mutate de la o mașină la alta la cerere, dar aceste linii nu au o "acasă adevărată", ca în alte scheme Multicomputerele sunt sisteme cu procesoare multiple, dar fără memorie partajată Fiecare dintre ei are propria sa memorie locală și comunică cu ceilalți prin mesaje Mașinile MPP, cum ar fi BlueGene/L de la IBM, sunt multicalculatoare mari conectate prin rețele de comunicații specializate Multicalculatoarele sunt adesea programate cu pachete software speciale, cum ar fi MPI, care permit dezvoltarea de aplicații orientate pe mesaje Schemele alternative sunt legate de utilizarea memoriei partajate la nivel de aplicație Acestea includ spațiul de adrese paginat din DSM, spațiul tuplu din Linda, obiectele din Orca și Globe Modelele DSM au partajat memorie la nivel de pagină și, în acest sens, sistemul DSM seamănă cu o mașină NUMA, cu excepția, probabil, a supraîncărcării mai mari de acces la distanță La nivelul superior sunt sistemele de calcul distribuite Acestea sunt cele mai slab cuplate sisteme; ele reunesc organizații întregi pentru a rezolva probleme comune, împărtășindu-și puterea de calcul, datele și alte resurse prin Internet Întrebări și sarcini În Pentium, lungimea instrucțiunii poate fi de până la octeți Este Pentium un procesor VLIW? Fie intervalul reprezentării mașinii a numărului - Ce se întâmplă când trunchiați numerele , - , și ? Sunt compatibile următoarele comenzi TriMedia și, dacă nu, de ce nu? ) adunare întregi, scădere întregi, încărcare, adunare în virgulă mobilă, încărcare directă; ) scădere întregi, înmulțire întregi, încărcare directă, deplasare, deplasare; ) încărcare directă, adăugare în virgulă mobilă, multiplicare în virgulă mobilă, ramificare, încărcare directă În fig , ghidul prezintă primele cicluri de instrucțiuni ale mașinii Pentru fiecare opțiune, descrieți ce se întâmplă în următoarele trei cicluri Pe un anumit procesor, cu o pierdere a memoriei cache la nivelul și o atingere a memoriei cache la nivelul , instrucțiunea este executată k cicluri de mașină Lăsați multithreadingul cu granulație fină să fie folosit pentru a masca erorile de cache din memoria cache de nivelul Câte fire de execuție de program trebuie să ruleze simultan pentru a evita complet buclele inactive? Dimineața, regina albină cheamă albinele lucrătoare și le informează că astăzi trebuie să culeagă nectar de gălbenele Albinele lucrătoare zboară din stup și zboară în direcții diferite în căutarea gălbenelelor Ce este acest sistem, SIMD sau MIMD? Întrebări și sarcini Când discutăm despre modelele de consistență a memoriei, am menționat că un astfel de model este un contract între software și memorie De ce este necesar un astfel de contract? Luați în considerare un multiprocesor cu o magistrală comună Ce se întâmplă dacă două procesoare încearcă să acceseze memoria globală în același moment? Să presupunem că, din motive tehnice, cache-ul servo poate urmări doar liniile de adresă, dar nu și liniile de date Va afecta această schimbare protocolul de scriere? Luați în considerare un model simplu de sistem multiprocesor cu o magistrală și fără cache Să presupunem că una din patru instrucțiuni accesează memoria și de fiecare dată când este accesată memoria, magistrala este ocupată pe durata instrucțiunii Dacă magistrala este ocupată, atunci procesorul solicitant este plasat în coada FIFO Cât de repede va rula un sistem cu de procesoare comparativ cu un sistem cu un singur procesor? Protocolul MESI are patru stări Un alt protocol pentru coordonarea cache-urilor de scriere înapoi are trei stări Care dintre statele protocolului MESI pot fi sacrificate și care ar fi consecințele fiecăreia dintre cele patru opțiuni? Dacă ar fi să alegi doar trei stări, pe care le-ai alege? Există situații în protocolul MESI când linia cache este prezentă în memoria cache locală, dar este totuși necesară o tranzacție cu magistrala? Dacă da, vă rugăm să descrieți situația Să presupunem că există n procesoare conectate la magistrala comună Probabilitatea ca unul dintre procesoare să încerce să folosească magistrala într-un anumit ciclu este p Care este probabilitatea ca: ) autobuzul este gratuit ( cereri); ) se face o cerere; ) se fac mai multe cereri Câte circuite de interconectare există într-un procesor Sun Fire E K complet? Să presupunem că firul dintre comutatorul A și comutatorul B din rețeaua omega este deteriorat Ce elemente vor fi separate unul de celălalt? Hotspot-urile (zonele de memorie care sunt accesate frecvent) în rețelele cu mai multe etape reprezintă o problemă serioasă Sunt acestea o problemă în sistemele de autobuze? Rețeaua omega conectează procesoare RISC, fiecare cu un timp de ciclu de ns, la module de memorie infinit de rapide Fiecare element de comutare dă o întârziere de ns Câte sloturi de amânare sunt necesare pentru o comandă LOAD? Luați în considerare o mașină care utilizează rețeaua omega (vezi Figura ) Să presupunem că programul și stiva i sunt stocate în modulul de memorie i Ce modificare minoră a topologiei poate face o mare diferență în performanță? Capitolul Arhitecturi de calculatoare paralele (Această topologie modificată este utilizată în IBM RP și BBN Butter-fly ) Ce dezavantaj are noua topologie față de cea veche? Într-un multiprocesor NUMA, accesarea memoriei locale durează ns, iar accesarea memoriei altui procesor durează ns Programul face N accesări la memorie în timpul execuției, dintre care % sunt accesări la pagina P Inițial, această pagină se află în memoria la distanță, iar C ns este necesar pentru a o copia din memoria locală În ce circumstanțe ar trebui să fie copiată această pagină la nivel local dacă nu o folosește niciun alt procesor? Luați în considerare un multiprocesor CC-NUMA precum cel din fig , dar care conține noduri a câte MB fiecare Dacă linia cache are o lungime de de octeți, care este procentul de supraîncărcare pentru directoare? Cum va afecta creșterea numărului de noduri supraîncărcarea (va crește, va scădea sau va rămâne neschimbată)? Calculați diametrul rețelei pentru fiecare dintre topologiile prezentate în fig Pentru fiecare dintre topologiile prezentate în fig , determinați factorul de toleranță la erori (numărul maxim de linii de comunicație, după pierderea cărora rețeaua nu va fi împărțită în două părți) Se consideră topologia dublu torus (vezi Fig , e) extinsă la dimensiunea k x k Care este diametrul unei astfel de rețele? (Sugestie: k par și impar trebuie luate în considerare separat ) Imaginează-ți o rețea sub forma unui cub de x x Fiecare legătură are o lățime de bandă duplex de GB/s Care este debitul unei secțiuni din această rețea? Legea lui Amdahl limitează potențiala accelerare realizabilă într-un computer paralel Calculați în funcție de f viteza maximă posibilă dacă numărul de procesoare tinde spre infinit Care este valoarea acestei limite pentru /= , ? Figura are scopul de a arăta că scalarea nu este posibilă cu o magistrală, ci posibilă și de dorit cu o rețea Să presupunem că fiecare magistrală sau linie de comunicație are o capacitate b Calculați debitul mediu per procesor pentru fiecare dintre cele patru cazuri Apoi scalați fiecare sistem până la de procesoare și executați aceleași calcule Care este limita dacă numărul de procesoare ajunge la infinit? În această carte, am discutat trei variante ale primitivei de trimitere - sincron, blocant și neblocant Sugerați o a patra opțiune, similară cu blocarea, dar ușor diferită în proprietăți Care sunt avantajele și dezavantajele noii primitive față de operația normală de trimitere de blocare? Luați în considerare un computer care funcționează într-o rețea cu difuzare hardware (ex Ethernet) De ce este important raportul dintre operațiile de citire (care nu schimbă starea internă a variabilelor) și operațiile de scriere (care schimbă starea internă a variabilelor)? Capitolul Bibliografie În capitolele anterioare, am discutat o gamă destul de largă de probleme cu diferite grade de detaliu Acest capitol este destinat acelor cititori care sunt interesați să afle mai multe despre arhitectura computerelor Secțiunea Citire pentru lectură suplimentară oferă o listă de publicații pentru lectură independentă, construită în conformitate cu subiectele tuturor capitolelor acestei cărți Secțiunea Referințe alfabetice conține o listă alfabetică a tuturor cărților și articolelor la care se face referire în această carte Literatură pentru lectură suplimentară Mai jos este o listă de publicații recomandate de autor pentru lectură suplimentară În cea mai mare parte, acestea sunt tutoriale, ghiduri practice și articole de recenzie Literatură introductivă și nespecială Borkar, Obținând cipuri Gigascale Legea lui Moore este probabil să fie valabilă încă zece ani, în cele din urmă riscăm să obținem microcircuite cu miliarde de tranzistori Această perspectivă nu este doar încurajatoare, dar pune și multe probleme dezvoltatorilor Acestea sunt pe care unul dintre cei mai importanți cercetători de la Intel le ia în considerare în articolul său Printre subiectele pe care le tratează se numără disiparea energiei și creșterea rezistenței, inclusiv capacitive, datorită plasării mai dense a conductorilor și reducerii dimensiunii acestora Autorul vede viitorul sistemelor de calcul nu într-o creștere simplă a frecvențelor de ceas, ci într-o combinație de hyper-threading, multiprocesare și organizare îmbunătățită a memoriei Colwell, Cronicile Pentium Robert Colwell este șeful echipei de dezvoltare Pentium În cartea sa, el vorbește despre creatorii acestui microcircuit, precum și despre pasiunile și intrigile din jurul acestuia Hamacher et al , Computer Organization, ed a -a Un manual tradițional despre organizarea computerelor (procesoare, memorie, I/O, aritmetică, periferice) Exemplele principale sunt și Power PC Heath Embedded proiectarea sistemelor Astăzi, aproape toate dispozitivele care costă mai mult de cincizeci de dolari, care funcționează pe curent electric, sunt controlate de computere Această carte - Capitolul Bibliografie despre sistemele de calcul încorporate În primul rând, sunt acoperite elementele de bază ale procesoarelor încorporate, memoriei și perifericelor, după care autorul trece la descrie mai multe categorii specifice, cum ar fi interfețe, sisteme de operare în timp real, software și depanare Hennessy și Patterson, Arhitectura calculatoarelor A Quantitative Approach, ed a -a În acest manual serios, problemele dezvoltării procesorului și memoriei sunt abordate în detaliu Accentul se pune pe atingerea performanțelor înalte, în special prin paralelism și conducte Această carte este pentru cei care doresc să știe totul despre designul procesorului de înaltă performanță Nuli și Lobur, Elementele esențiale ale organizării și arhitecturii computerelor Un alt ghid pentru organizarea sistemelor de calcul, care conturează destul de concis multe dintre subiectele abordate în cartea noastră Patterson și Hennessy, Computer Organization and Design, ed a -a Această ediție, ca și a doua, are peste de pagini, dar acum o parte semnificativă a textului a fost mutată de pe hârtie pe CD-ul însoțitor Gama tematică este foarte largă - aici este analizată arhitectura computerului din diverse puncte de vedere Printre alte subiecte, discuțiile includ aritmetica, performanța, organizarea căilor de date, pipelining, memorie, periferice și clustere Pentium este menționat doar în fragmente din carte, iar majoritatea exemplelor se referă la procesorul MIPS, care a fost proiectat chiar de Hennessy și a dat naștere în primului model comercial al procesorului RISC Prețul, o istorie a mașinilor de calcul Calculatoarele moderne se întorc la mașina lui Babbage din secolul al XIX-lea, dar oamenii au făcut tot felul de calcule încă de la începutul civilizației Acest articol ilustrat urmărește întreaga istorie a numărării, matematicii, calendarelor și calculului din î Hr e până la începutul secolului al XX-lea Slater, Portrete în silicon De ce și-a luat Dennis Ritchie doctoratul de la Harvard? De ce a devenit Steve Jobs vegetarian? Puteți găsi răspunsuri la aceste întrebări și la alte întrebări în această carte fascinantă Cartea conține de biografii scurte ale oamenilor care au modelat industria computerelor (de la Charles Babbage la Donald Knuth) Stallings, Computer Organization and Architecture, ed a VI-a O carte despre arhitectura computerelor De asemenea, ridică întrebările pe care le-am discutat în cartea noastră Wilkes, Calculatoare atunci și acum Autorul cărții, Maurice Wilks, unul dintre primii designeri de computere și inventator de microprogramare, conturează istoria computerelor din până în El vorbește despre războiul dintre adepții programării automate ("cadeții spațiali") și tradiționaliștii care au preferat să programeze în sistem octal Literatură pentru lectură suplimentară Organizarea sistemelor informatice Buchanan și Wilson, Advanced PC Architecture, În ciuda unei anumite spontaneități de prezentare, această lucrare merită recomandări bune ca un ghid bun pentru proiectarea procesoarelor, magistralelor (PCI, SCSI și USB), porturi (jocuri, paralele și seriale) și a altor componente ale PC-ului Ng, Progrese în tehnologia discurilor: probleme de performanță În ultimii de ani, experții au prezis în mod constant învechirea discurilor magnetice Cu toate acestea, discurile sunt încă în uz Această lucrare spune că tehnologia discurilor magnetice se dezvoltă rapid, iar discurile magnetice ne vor servi mulți ani de acum înainte Messmer, The Indispensable PC Hardware Book, ed a -a O carte groasă de de pagini ( de capitole și anexe) care intră în detaliu despre procesoare x , memorie, autobuze, cipuri auxiliare și periferice Dacă ați citit deja cartea lui Norton și Goodman descrisă mai jos și doriți mai multe informații, vă rugăm să consultați această lucrare Norton și Goodman, Inside the PC, ed a -a Majoritatea cărților despre hardware sunt scrise pentru inginerii electronici și sunt greu de citit pentru cei care lucrează în software Această carte nu este așa Acesta spune simplu și clar despre hardware-ul computerelor personale Vorbim de procesoare, memorie, autobuze, discuri, monitoare, dispozitive I/O, calculatoare personale portabile, rețele etc Într-un cuvânt, muncă de o valoare rară Robinson, Către era stocării mai inteligente De pe vremea nucleelor magnetice și a cardurilor perforate, tehnologiile de stocare au evoluat semnificativ Acest scurt articol se concentrează pe trecutul, prezentul și viitorul acestor tehnologii Scheible, Un studiu asupra opțiunilor de stocare O altă lucrare despre tehnologiile de memorie, în care cea mai mare atenție este acordată stării lor actuale Printre subiectele discutate se numără numeroase varietăți de RAM, memorie flash, unități de bandă, hard disk-uri, dischete, CD-uri, DVD-uri Stan și Skadron, Power-Aware Computing Puterea de calcul a computerelor moderne este în continuă creștere, iar nivelul consumului de energie crește în paralel Odată cu dezvoltarea rapidă a tehnologiei mobile, această problemă devine din ce în ce mai acută Acest articol a fost scris de editorii invitați ca o introducere la subiectul consumului de energie al computerului pentru un număr special al IEEE Computer Magazine Triebel, Procesorul , și Pentium Această carte acoperă diverse probleme legate de interfețe, hardware și software, clasificați-o destul de mult Capitolul Bibliografie dificil Favoarea orientării "hardware" este dovedită doar de faptul că autorul lucrează la Intel În munca sa, el vorbește nu numai despre procesoare, memorie, dispozitive I/O și interfețe ale microcircuitelor x , ci și despre programarea acestora în limbaj de asamblare Cartea are "doar" pagini, dar datorită formatului lor mare, cantitatea de material acoperită nu este inferioară lucrării lui Messmer menționată puțin mai devreme Nivel logic digital Floyd, Digital Fundamentate, ed a -a Această carte ilustrată uriașă este destul de potrivită pentru cei care doresc să studieze mai detaliat nivelul logicii digitale Acesta acoperă logica combinatorie, logica programabilă, flip-flops, registre de deplasare, memorie, interfețe și multe altele Mano și Kime, Logic and Computer Design Fundamentate, ed a III-a Această carte nu este la fel de bine dezvoltată și înțeleasă ca cartea lui Floyd, dar este și un ghid bun pentru nivelul logicii digitale Conține informații despre circuite combinatorii și secvențiale, registre, memorie, procesoare și dispozitive I/O Mayhew și Krishan, PCI Express și Advanced Switching Cel mai probabil, în viitorul apropiat, magistrala PCI Express va înlocui complet magistrala PCI din pozițiile sale actuale Acest articol oferă o descriere cuprinzătoare a acestei noi tehnologii - în special, niveluri ierarhice, mecanism de control al fluxului de date, circuite virtuale, comutare și urmărire Mazidi și Mazidi, The x IBM PC and Compatible Computers, ed a -a Cartea este destinată cititorilor care sunt interesați de structura microcircuitelor tuturor procesoarelor unui computer personal Cartea conține capitole întregi despre microcircuite de bază, precum și o mulțime de alte informații despre hardware și programare în limbaj de asamblare Roth, Fundamentele designului logic Această lucrare conturează principiile de bază de proiectare la nivel de logică digitală În special, autorul descrie utilizarea porților, contoarelor, sumatorilor, flip-flops-urilor și a altor circuite combinatorii și secvențiale în algebra booleană nivelul microarhitecturii Burger și Goodman, arhitecturi de miliarde de tranzistori: acolo și înapoi Imaginați-vă că în vi s-a oferit oportunitatea de a proiecta un cip cu un miliard de tranzistori Ce microarhitectură ați alege pentru un astfel de cip? În septembrie , această întrebare a fost adresată șapte arhitecți de top, care și-au publicat răspunsurile detaliate în IEEE Computer Magazine Șapte ani mai târziu, proiectele lor au fost comparate cu situația tehnologică actuală Rezultatele le puteti afla din acest articol; Literatură pentru lectură suplimentară Handy, Cartea memoriei cache, ed a II-a Problema designului cache-ului este foarte importantă, așa că există cărți întregi dedicate acestei probleme Această carte discută cache-urile logice și fizice, dimensiunea liniei, scrierea și rescrierea, cache-urile grupate și divizate și câteva subiecte legate de software Un întreg capitol este dedicat consistenței cache-urilor într-un multiprocesor Johnson, Design de microprocesor superscalar Dacă sunteți interesat de detaliile dezvoltării procesoarelor superscalare, această carte este locul de început Acesta acoperă invocarea și decodarea instrucțiunilor, execuția instrucțiunilor cu resecvențiere, înlocuirea registrelor, stațiile de redundanță, predicția de ramuri și multe altele Shriver și Smith, Anatomia unui microprocesor de înaltă performanță Această carte este potrivită pentru un studiu detaliat al procesorului modern la nivel de microarhitectură Cipul AMD Kb (clona Pentium) este descris în detaliu Vorbește despre conducte, programarea execuției comenzilor, modalități de îmbunătățire a performanței Sima, Problema cu instrucțiuni superscalare Execuția instrucțiunilor superscalare este extrem de importantă în procesoarele moderne În cartea noastră, am atins câteva aspecte conexe (în special, înlocuirea cazurilor și execuția speculativă) Acest articol abordează aceste întrebări și multe alte întrebări Wilson, Provocări și tendințe în proiectarea procesoarelor Dezvoltarea procesorului este în criză? Șase furnizori de top de procesoare de la Sun, Cyx, Motorola, Mips, Intel și Digital vorbesc despre cum vor evolua procesoarele în următorii câțiva ani În , probabil că va fi amuzant de citit, dar, între timp, este interesant să le cunoaștem pozițiile Stratul de arhitectură set de instrucțiuni Antonakos, Microprocesorul Pentium Primele nouă capitole ale acestei cărți acoperă modul de programare a Pentium-ului în limbaj de asamblare Ultimele două vorbesc despre hardware-ul Pentium Sunt date numeroase fragmente de programe Se ia în considerare sistemul de bază de intrare-ieșire Ayala, Microcontrolerul , ed a -a Dacă doriți să învățați cum să programați controlerele , este logic să începeți cu această carte Bryant și O'Hallaron, Sisteme informatice Perspectiva unui programator Deși destul de haotică, această carte acoperă multe subiecte fundamentale ale nivelului arhitecturii instrucțiunilor, cum ar fi operațiile aritmetice, tipurile de instrucțiuni, fluxurile de control și optimizarea programelor Capitolul Bibliografie Paul, SPARC Arhitectură, limbaj de asamblare, programare și C În mod surprinzător, această carte despre programarea în limbaj de asamblare nu este deloc despre linia de procesoare Intel x Vorbește despre computerul SPARC și despre cum se programează pe el Weaver și Germond, Manualul de arhitectură SPARC În legătură cu internaționalizarea industriei computerelor, problemele de standardizare ies în prim-plan Acest ghid pentru procesorul SPARC versiunea oferă o idee bună despre cum ar trebui să arate standardul Cartea conține, de asemenea, o mulțime de informații utile despre cum funcționează procesoarele SPARC pe de biți Nivelul sistemului de operare Hart, programarea sistemului Win Spre deosebire de majoritatea cărților Windows, aceasta nu este deloc despre interfața grafică cu utilizatorul Se concentrează pe apelurile de sistem Windows și utilizarea acestora pentru accesul la fișiere, gestionarea memoriei și a proceselor, comunicarea între procese, controlul firelor de program, procesele I/O și așa mai departe Jacob și Mudge, memorie virtuală" Probleme de implementare O carte bună despre memoria virtuală modernă Vorbește despre tabelele de pagini și despre bufferul de căutare rapidă folosind procesoare MIPS, Power PC și Pentium ca exemple McKusick et al , Design and Implementation of the BSD Operating System Spre deosebire de majoritatea cărților UNIX, aceasta începe cu o fotografie a celor patru autori la conferința USENIX Trei dintre ei au scris pe larg despre pachetul BSD și sunt foarte calificați în acest subiect Cartea vorbește despre apeluri de sistem, procese, I/O O întreagă secțiune este dedicată rețelelor Ritchie și Thompson, Sistemul de partajare a timpului UNIX Aceasta este prima lucrare pe sistemul UNIX Și totuși merită citit Din această mică sămânță a crescut un sistem de operare grozav Russinovici și Solomon, În interiorul Microsoft Windows, ed a -a Dacă vrei să știi cum funcționează Windows, această carte este pentru tine Se discută despre arhitectura și mecanismele sistemului, procesele, fluxurile de programe, managementul memoriei, securitatea, I/O, memoria cache, sistemele de fișiere etc Publicul țintă este studenții sistemelor informatice și profesioniștii în tehnologia informației Tanenbaum și Woodhull, Sisteme de operare" Proiectare și implementare, ed a II-a Majoritatea cărților despre sistemele de operare tratează doar aspecte teoretice În această carte, teoria este ilustrată cu cod real pentru sistemul de operare MINIX, o clonă a UNIX, care rulează pe computere IBM și alte computere Codul sursă cu comentarii detaliate este dat în anexă Literatură pentru lectură suplimentară Nivel de asamblare Levine, legături și încărcătoare Dacă sunteți interesat de linkere și încărcătoare, înțelegeți formatele obiectelor și bibliotecii și înțelegeți cum diferă legarea statică de conectarea dinamică, această carte este pentru dvs Saloman, Asambleri și Încărcătoare Tot ce ați dorit vreodată să știți despre asamblatorii cu o singură trecere și cu două treceri, precum și despre linkere și încărcătoare, macrocomenzi și legături condiționate Arhitecturi de computere paralele Adve și Gharachorloo, Modele de consistență a memoriei partajate" Un tutorial Multe computere moderne, în special multiprocesoare, acceptă un model de memorie mai puțin strict decât modelul de consistență secvențială Acest tutorial discută diferitele modele și explică modul în care funcționează Numeroase mituri despre un model de memorie slabă sunt, de asemenea, prezentate și infirmate aici Colț, Proiectare sisteme de rețea Prima parte a cărții este dedicată metodelor tradiționale de procesare a pachetelor de rețea A doua parte tratează procesoarele de rețea, scopul acestora, arhitecturile și diverse soluții de proiectare În a treia parte, este analizat un exemplu specific - procesorul de rețea Agere Dally și Towles, Principii și practici ale rețelelor de interconectare Această carte este pentru cei care sunt interesați de rețelele de comunicare După o introducere generală în topologii, sunt luate în considerare topologiile de rețea fluture și torus, precum și topologiile neblocante Acesta este urmat de capitole despre urmărire, controlul fluxului, tamponare, blocaj și probleme conexe Dongarra et al , The Sourcebook of Parallel Computing Tehnicile de programare pentru multiprocesoare și clustere sunt radical diferite de cele pentru sistemele cu un singur proces Șapte experți de top în această carte își prezintă punctele de vedere asupra diferitelor aspecte ale programării paralele, în special despre arhitecturile paralele, tehnologiile software, algoritmii paraleli și unele aplicații NIP, multiprocesoarele ar trebui să accepte modele simple de consistență a memoriei Modelele de memorie non-strictive sunt o problemă importantă și controversată care apare la proiectarea memoriei pentru un multiprocesor Astfel de modele fac posibilă efectuarea anumitor optimizări hardware (de exemplu, schimbarea ordinii acceselor la memorie), dar complică programarea În acest articol, autorul ridică diverse probleme legate de consistența memoriei și ajunge la concluzia că memoria slabă are mai multe probleme decât beneficii Capitolul Bibliografie Hwang și Xu, Scalable Parallel Computing Autorii iau în considerare atât software-ul, cât și hardware-ul, așa că au reușit să acopere subiectul calculului paralel într-un mod cuprinzător și accesibil Cartea vorbește despre multiprocesoare UMA și NUMA, sisteme MPP, clustere, transmitere de mesaje, programare paralelă Lawton, unitățile de procesoare de rețea își vor îndeplini promisiunile Se crede că procesoarele de rețea sunt capabile să accelereze procesarea pachetelor, dar este încă dificil să se garanteze acest lucru În articolul său, autorul analizează atât tehnologia în sine, cât și o serie de factori care pot afecta dezvoltarea ulterioară a acesteia McKnight și colab , Wireless Grids, De îndată ce a apărut computerul distribuit, problema următoarei lor generații, fără fir, a devenit relevantă La fel ca sistemele de calcul distribuite convenționale, versiunea lor fără fir servește la partajarea resurselor de calcul ale diferitelor organizații pentru a crea organizații virtuale, dar utilizatorii mobili pot fi, de asemenea, implicați în calculul distribuit fără fir Următoarele două lucrări sunt, de asemenea, dedicate calculului distribuit fără fir Pfister, În căutarea clusterelor, ed a -a Deși definiția unui cluster apare doar la pagina (un grup de calculatoare care lucrează împreună), acest concept include în mod evident toate sistemele convenționale multicomputer și multiprocesor Hardware-ul și software-ul lor, performanța și disponibilitatea sunt luate în considerare în detaliu Avertizăm cititorul: deși stilul de prezentare al autorului pare la început fascinant, până la pagina a -a, toată fascinația dispare Snir şi colab , MPP Manualul de referință complet Numele vorbește de la sine Dacă doriți să învățați cum să programați folosind pachetul MPI, vă rugăm să consultați acest manual Cartea acoperă interacțiunea punct-la-punct și colectivă, comunicatori, managementul mediului și multe altele Stenstrom și colab , Trends in Shared Memory Multiprocessing Multiprocesoarele cu memorie partajată sunt adesea considerate supercalculatoare pentru calculul științific complex În realitate, aceasta este doar o mică parte a pieței lor Articolul discută ce domenii acoperă piața pentru astfel de mașini și care este semnificația arhitecturii lor Ungerer și colab , A Survey of Processors with Explicit Multithreading Această lucrare conturează principiile de funcționare a tuturor tipurilor majore de multithreading Pe lângă partea teoretică, există exemple de aplicații științifice și comerciale ale acestei tehnologii în sistemele de calcul Wolf, Viitorul sistemelor multiprocesoare pe cipuri După ce a descris trei soluții moderne de design pentru sisteme cu un singur procesor, autorul ia în considerare problemele viitoarelor hardware și software Literatură pentru lectură suplimentară de furnizare a unor astfel de sisteme În special, sunt abordate problemele de funcționare în timp real, disiparea puterii, sisteme de operare și securitate Numere binare și în virgulă mobilă Cody, Analiza propunerilor pentru standardul în virgulă mobilă Cu ceva timp în urmă, IEEE a propus o arhitectură de instrucțiuni în virgulă mobilă care a devenit standardul de fado pentru toate procesoarele moderne Autoarea discută diverse întrebări, sugestii și obiecții care au apărut în timpul standardizării IEEE, Proc al celui de-al n-lea Simpozion de aritmetică computerizată Contrar credinței populare, aritmetica este un domeniu de cercetare activă O mulțime de lucrări științifice au fost scrise de specialiști La simpozionul căruia îi sunt dedicate aceste materiale, subiectele progresiilor, algoritmii de adunare rapidă și înmulțire, hardware aritmetic VLSI, coprocesoare , toleranța la erori, rotunjirea și multe altele au fost discutate Cohen, Algoritmi de aritmetică computerizată O lucrare de aritmetică care se concentrează pe algoritmi rapidi pentru adunare, înmulțire și împărțire Lectură recomandată celor care cred că până în clasa a șasea de liceu au știut și au citit tot ce este posibil despre aritmetică Knuth, Algoritmi semimerici, ed a III-a Material extins despre sisteme de numere poziționale, aritmetică în virgulă mobilă, aritmetică cu precizie multiplicată și numere aleatoare Cartea necesită și merită un studiu atent Wilson, Kit de supraviețuire în virgulă flotantă Carte bună pentru începători despre numerele și standardele în virgulă mobilă Discută câteva probleme populare legate de numerele în virgulă mobilă (de exemplu, Linpack) Programare în limbaj de asamblare Blum, limbaj de asamblare profesional Limbajul de asamblare Procesor Pentium Ghidul programator Presupune că aparatul Pentium al cititorului rulează Linux Se concentrează pe asamblatorul Linux, instrumentele GNU și apelurile de sistem Linux Irvine, Limbajul de asamblare pentru computere bazate pe Intel, ed a -a Subiectul principal al cărții este programarea procesoarelor Intel în limbaj de asamblare În plus, aici sunt abordate probleme de programare I/O, macrocomenzi, fișiere, legături, întreruperi etc Capitolul Bibliografie Lista alfabetică de referințe Adams, M și Dulchinos, D "OpenCable", IEEE Commun Magazine, voi , pp - , iunie Adiga, N R et al "O prezentare generală a supercomputerului BlueGene/L", Proc Supercomputing , ACM, pp - , Adve, SV și Charachorloo, K Shared Memory Consistency Models: A Tutorial, IEEE Computer Magazine, voi , pp - , dec Adve, SV și HUI, M "Ordinarea slabă: O nouă definiție", Proc a -a An Int'l Symp pe Computer Arch , ACM, pp - , Agerwala, T și Cocke, J "Procesoare de set de instrucțiuni reduse de înaltă performanță", IBM TJ Raportul tehnic al Centrului de Cercetare Watson RC , Alameldeen, AR și Wood, DA "Adaptive Cache Compression for High-Performance Processors" Proc An Int'l Sym pe Computer Arch ACM, pp - , Almasi, GS et al "Gestionarea sistemului în supercomputerul BlueGene/L", Proc Int'l Paralel și Distr Proc Symp , IEEE, a Almasi, GS et al "O prezentare generală a organizației software de sistem Bluegene/L", Par Proc Scrisori, voi , - , aprilie b Amza, C , Cox, A , Dwarkadas, S , Keleher, P , Lu, H , Rajamony, R , Yu, IV, Zwae-nepoel, IV "TreadMarks: Shared Memory Computing pe o rețea de stații de lucru", IEEE Computer Magaxine, voi , pp - februarie Anderson, D Universal Serial Bus System Architecture, Reading, MA: Addison-Wesley, Anderson, D , Budruk, R și Shanley, T PCI Express System Architecture, Reading, MA: Addison-Wesley, Anderson, TE, Culler, DE, Patterson, DA, și echipa NOW "A Case for NOW (Networks of Workstations)", IEEE Micro Magazine, voi , pp - , feb Antonakos, JL Microprocesorul Pentium, Upper Saddle River, NJ: Prentice Hali, August, D L, Connors, DA, Mshlke, SA, SIAS, JW, Crozier, K M , Cheng, B -C , Eaton, PR, Olaniran, QB și HWU, W -M "Execuția integrată predicată și speculativă în arhitectura IMPACT EPIC", Proc a -a An Int'l Symp pe Computer Arch , ACM, pp - , Ayala, K The Microcontoller, a -a ed , Clifton Park, NY: Thomson Delmar Leaning, Bal, H E Programming Distributed Systems, Hemel Hempstead, Anglia: Prentice Hali Int'l , Bal, HE, Bhoedjang, R , Hofman, R, Jacobs, C , Langendoen, K , Ruhl, T și Kaashoek, MF "Performance Evaluation of the Orca Shared Object System", ACM Trans on Computer Systems, voi , pp - feb Lista alfabetică de referințe Bal, H E , Kaashoek, M E și Tanenbaum, A S "Orca: A Language for Parallel Programming of Distributed Systems", traducerea IEEE on Software Engineering, voi , pp - , martie Bal, HE și Tanenbaum, AS "Programare distribuită cu date partajate", Proc Int'l Conf despre limbaje computerizate, IEEE, pp - , Barroso, LA, Dean, J , Holzle, U "Web Search for a Planet: The Google Cluster Architecture", IEEE Micro Magazine, voi , pp - , martie-aprilie Bechini, A , Conte, TM și Prete, CA Opportunities and Challenges in Embedded Systems, IEEE Micro Magazine, voi , pp - , iulie-aug Benini, L și De Micheli, G "Networks on Chips A New SoC Paradigm, IEEE Computer Magazine, voi , pp - , ian Berman, F , Fox, G și Hei, AJ G Grid Computing: Making the Global Infrastructura a Reality, Hoboken, NJ: John Wiley, Bjomson, R D "Linda on Distributed Memory Multiprocessors", Ph D Teză, Yale University, Blum, R Professional Assembly Language, New York: Wiley, Blumrich, M , Chen, D , Chiu, G , Coteus, P , Gara, A , Giampapa, ME, Haring, RA , Heidelberger, P , Hoenicke, D , Kopcsay, GV, Ohmacht, M , Steinmacher-Burow, BD, Takken, T , Vransas, P și Liebsch, T "O privire de ansamblu asupra sistemului BlueGene/L", IBM J Research and Devei , voi , martie-mai, Borkar, S "Getting Gigascale Chips", Queue, pp - oct Bose, P Computer architecture research: Shifting priorities and newer challenges, IEEE Micro Magazine, voi , p , nov-dec Bouknight, WJ, Denenberg, SA, Mcintyre, DE, Randall,} M , Sameh, AH și Slotnick, DL "The liliac IV System", Proc IEEE, pp - , aprilie Brightwell, R , Câmp, W , Cole, B , DeBenedictis, Leland, R, and TompkinsJ "Specificații arhitecturale pentru calculatoare masiv paralele - O abordare bazată pe experiență și măsurători", ftp://ftp cs sandia gov/pub/papers/bright/redstorm-ccpe pdf Bryant, RE și O'Hallaron, D Computer Systems: A Programmer's Perspective Upper Saddle River, NJ: Prentice Hali, Buchanan, W , Wilson, A Advanced PC Architecture, Reading, MA: Addison-Wesley, Burger, D și Goodman, JR "Billion-Transistor Architectures: There and Back Again", IEEE Computer Magazine, voi , pp - martie Burkhardt, H , Frank, S , Knobe, B și Rothnie, J "Overview of the KSR- Computer System", Raport tehnic KSR-TR- , Kendall Square Research Corp, Cambridge, MA, Cain, H , and Lipasti, M "Ordinarea memoriei: o abordare bazată pe valoare", Proc a -a An Simp Internaţional pe Computer Arch , ACM, pp - , Capitolul Bibliografie Calcutt, D , Cowan, F și Parchizadeh, H Microcontrollers: An Applications Based Introduction, Oxford: Newnes, Carriero, N , și Gelernter, D "Linda și Context", Comun al ACM, voi , pp - , aprilie Charlesworth, A "The Sun Fireplane Interconnect", IEEE Micro Magazine, voi , pp - , ian -feb Charlesworth, A "The Sun Fireplane Interconnect", Proc Conf pe High Perf Networking and Computing, ACM, Charlesworth, A , Phelps, A , Williams, R și Gilbert, G "Gigaplane-XB: Extending the Ultra Enterprise Family", Proc Hot Interconnects V, IEEE, Chen, L , Dropsho, Albonesi, D H "Dynamic Data Dependence Tracking and its Application to Branch Prediction", Proc Simptomul Internațional al nouălea on High-Performance Computer Arch , IEEE, pp - , Chou, K, Fahs, B , Abraham, S "Microarchitecture Optimizations for Exploiting Memory-Level Parallelism", CQ Proc An Simp Internaţional pe Computer Arch , ACM, pp - , Claasen, TACM "System on a Chip: Changing IC Design Today and in the Future", IEEE Micro Magazine, voi , pp - , mai-iunie Cody, J "Analysis of Proposals for the Floating-Point Standard", IEEE Computer Magazine, voi , pp - , mar Cohen, D "On Holy Wars and a Plea for Peace", IEEE Computer Magazine, voi , pp - , oct Colwell, R The Pentium Chronicles New York: Wiley, Corner, D E "Network Systems Design Using Network Processors: Agere Version", Upper Saddle River, NJ: Prentice Hali, Corbato, FJ "PL/ as a Tool for System Programming", Datamation, voi , pp - , mai Corbato, FJ și Vyssotsky, VA "Introducere și prezentare generală a sistemului MULTICS", Proc FJCC, pp - , Crowley, P , Franklin, MA, Hadimioglu, EL și Onufryk, PZ Network Processor Design: Issues and Practices, Voi , San Francisco: Morgan Kaufmann, Dally, WJ și Towles, BP Principles and Practices of Interconnection Networks, San Francisco: Morgan Kaufmann, Daneshbeh, AK și Hasan, MA "Criptoprocesor cu curbă eliptică de mare viteză eficientă în zonă pentru curbe aleatorii", Proc Int'l Conf pe Inf Teh : Coding Speculative Execution and Computing, IEEE, pp - , Dean, AG "Efficient Real-Time Fine-Grained Concurrency on Low-Cost Microcontrollers", IEEE Micro Magazine, voi , pp - , iulie-aug Denning, PJ "The Working Set Model for Program Behavior", Comun al ACM, voi , pp - , mai Lista alfabetică de referințe Dijkstra, E W "Declarația GOTO considerată nocivă", Comun al ACM, voi , pp - , mar a Dijkstra, E W "Co-operating Sequential Processes", în Programming Languages, F Genuys (ed ), New York: Academic Press, b Donaldson, G și Jones, D "Arhitecturi de rețea de bandă largă de televiziune prin cablu", IEEE Commun Magazine, voi , pp - , iunie Dongarra, J , Foster, L, Fox, G , Gropp, IF , Kennedy, K, Torczon, L și White, A The Sourcebook of Parallel Computing San Francisco: Morgan Kaufman, Dubois, M , Scheurich, C și Briggs, F A "Buffering pentru acces la memorie în multi-procesoare", Proc a -a An Int'l Symp pe Computer Arch , ACM, pp - , Dulong, C "The IA- Architecture at Work", IEEE Computer Magazine, voi , pp - iulie Dutta-Roy, A "An Overview of Cable Modem Technology and Market Perspectives", IEEE Commun Magazine, voi , pp - , iunie Eschmann, E, Klauer, B , Moore, R și Waldschmidt, K "SDAARC: An Extended Cache-Only Memory Architecture", IEEE Micro Magazine, voi , pp - , mai-iunie, Faggin, F , Hoff, ME, Jr , Mazor, S și Shima, M "The History of the ", IEEE Micro Magazine, voi , pp - nov Falcon, A , Stark, J , Ramirez, A , Lai, K și Valero, M "Prophet/Critic Hybrid Branch Prediction", Proc a -a An Simp Internaţional pe Computer Arch , ACM, pp - , Fisher, JA, și Freudenberger, SM "Predictarea direcțiilor de ramuri condiționate din execuțiile anterioare ale unui program", Proc a -a Conf pe Arh Suport pentru Prog Lang și Sistem de operare, ACM, pp - , Floyd, TL Digital Fundamentals, a -a ed , Upper Saddle River, NJ: Prentice Hali, Flynn, D "AMBA: Enabling Reusable On-Chip Designs", IEEE Micro Magazine, voi , pp - iulie Flynn, MJ "Unele organizații de calculatoare și eficacitatea lor", IEEE Trans pe computere, voi C- , pp - , sept Foster, L și Kesselman, C The Grid : Blueprint for a New Computing Infrastructure, San Francisco: Morgan Kaufman, Foster, L, Kesselman, C , Nick, JM și Tuecke, S "Grid Services for Distributed Systems Integration", IEEE Computer Magazine, voi , pp - , iunie Foster, L și Kesselman, C "Globus: A Metacomputing Infrastructure Toolkit", Int'L J of Supercomputer Applications, voi , pp - , a Foster, L și Kesselman, C "The Globus Project: A Status Report", IPPS/SPDP ' Heterogeneous Computing Workshop, IEEE, pp - , b Capitolul Bibliografie Fotheringham, J "Alocarea dinamică a stocării în computerul Atlas, inclusiv utilizarea automată a unui magazin de suport", comun al ACM, voi , pp - , oct Geist, A , Beguelin, A , Dongarra, J , Jiang, IV , Mancheck, R și Sunderram, V, PVM: Parallel Virtual Machine - A User's Guide and Tutorial for Networked Parallel Computing, Cambridge, MA: MIT Press, Gerber, R și Binstock, A Programming with Hyper-Threading Technology, Santa Clara, CA: Intel Press, Ghemawat, S , Gobioff, H și Leung, S -T "Sistemul de fișiere Google", Proc Symp despre principiile sistemelor de operare, ACM, pp - , Goodman, J R, "Utilizarea memoriei cache pentru a reduce traficul din memoria procesorului", Proc oth Ann Int'l Symp pe Computer Arch , ACM, pp - , Goodman JR "Consistență în cache și consistență secvențială", Tech Reprezentant , IEEE Scalable Coherent Interface Working Group, IEEE, Grimshaw, A și Wulf, IV "Legiune: O vedere de la de picioare", Proc al cincilea Int'l Symp despre calculul distribuit de înaltă performanță, IEEE, pp - , aug Grimshaw, A și Wulf, IV "Viziunea legionară a unui computer virtual mondial", Comun al ACM, voi , pp - ian Gropp, IV , Lusk, E și Skjellum, A "Using MPI: Portable Parallel Programming with the Message Passing Interface", Cambridge, MA: MIT Press, Gurumurthi, S , Sivasubramaniam, Kandemir, M și Franke, H "Reducing Disk Power Consumption in Servers with DRPM", IEEE Computer Magazine, voi , pp - , dec Hagersten, E , Landin, A , Haridi, S "DDM - A Cache-Only Memory Architecture", IEEE Computer Magazine, voi , pp - , sept Hamacher, VV, Vranesic, ZG și Zaky, G Computer Organization, a -a ed , New York: McGraw-Hill, Hamming, R IV "Detectarea erorilor și codurile de corectare a erorilor", Beli Syst Teh J , voi , pp - , aprilie Hammond, L, Wong, V , Chen, M , Hertzberg, B, Davis, J , Carlstrom, B , Prabhu, M , Wijaya, H, Kozyrakis, C și Olukotun, K " Coerența și consistența memoriei tranzacționale, Proc a -a An Simp Internaţional pe Computer Arch , ACM, pp - , Handy, J The Cache Memory Book, a doua ed , Orlando, FL: Academic Press, HartJ M Win System Programming, Reading, MA: Addison-Wesley, Heath, S Embedded Systems Design, Oxford: Newnes, Henkel, J , Hee, XS și Bhattacharyya, SS, "Taking on the Embedded System Challenge", IEEE Computer Magazine, voi , pp - , aprilie Hennessy, J, L "Arhitectura procesorului VLSI", IEEE Trans pe computere, voi C- , pp - Dec Lista alfabetică de referințe Hennessy, JL și Patterson, D A Computer Architecture A Quantitative Approach, ed a -a San Francisco: Morgan Kaufmann, HUI, M "Multiprocessors Should Support Simple Memory-Consistency Models", IEEE Computer Magazine, voi , pp - , aug Hinton, G , Sager, D , Upton, M , Boggs, D , Carmean, D , Kyker, A , Roussel, P "The Microarchtecture of the Pentium ", Intel Technology Journal, voi , pp - , ianuarie-martie, Hoare, CAR "Monitoarele, un concept de structurare a sistemului de operare", Com al ACM, voi , pp - , oct ; Eroare în comun al ACM, voi , p , februarie Huh, J , Burger, D , Chang, J și Sohi, GS "Speculative Incoherent Cache Pro-tocols", IEEE Micro Magazine, voi , pp - , nov -dec Hwang, K și Xu, Z Scalable Parallel Computing, New York: McGraw-Hill, Hwu, W -M "Introduction to Predicated Execution", IEEE Computer Magazine, voi , pp - , ian Irvine, K Assembly Language for Intel-Based Computers, a patra ed , Upper Saddle River, NJ: Prentice Hali, Jacob, B și Mudge, T "Virtual Memory: Issues of Implementation", IEEE Computer Magazine, voi , pp - , iunie a Jacob, B și Mudge, T "Virtual Memory in Contemporary Microprocessors", IEEE Micro Magazine, voi , pp - , iulie/aug b Jerraya, A A și Wolf IV Multiprocessor Systems-on-a-Chip, San Francisco: Morgan Kaufmann, Jimenez, D A Fast Path-Based Neural Branch Prediction, Proc Simptomul Internațional al -lea despre Microarhitectură, IEEE , pp - , Johnson, KL, Kaashoek, MF și Wallach, DA "CRL: High-Performance AII-Software Distributed Shared Memory", Proc al -lea Symp despre principiile sistemelor de operare, ACM, pp - , Johnson, M Superscalar Microprocessor Design, Englewood Cliffs, NJ: Prentice Hali, Kalla, R , Sinharoy, B și Tendler, JM "IBM Power Chip: A Dual-Core Multi-threaded Processor", IEEE Micro Magazine, voi , pp - , martie-aprilie Kapasi, UJ, Rixner, S , Dally, WJ, Khailany, B , Ahn, J H, Mattson, P și Owens, JD "Programmable Stream Processors", IEEE Computer Magazine, voi , pp - , aug Kapil, S , M C Ghan, H, și Lawrendra, J "A Chip Multithreaded Processor for Network-Facing Workloads", IEEE Micro Magazine, voi , pp - martie-aprilie Katz, RH și Borriello, G Contemporary Logic Design, Upper Saddle River NJ: Prentice Hali, Capitolul Bibliografie Kaufman, C , Perlman, R și Speciner, M Network Security, a doua ed , Upper Saddle River, NJ: Prentice Hali, Kermarrec , A -M , Kuz, I , Van Steen, M și Tanenbaum, AS "A Framework for Consistent Replicated Web Objects", Proc al -lea Int'l Conf pe Distr Computing System, IEEE, pp - , Kim, NS, Austin, T , Blaauw, D , Mudge, T , Flautner, K , Hu, JS, Irwin, MJ, Kandemir, M și Narayanan, V Leakage Current: Moore's Law Meets Static Power, IEEE Computer Magazine, voi , pp - , dec Knuth, D E "An Empirical Study of FORTRAN Programs", Software - Practice & Experience, voi , pp - , Knuth, D E The Art of Computer Programming: Fundamental Algorithms, Ed a -a Reading, MA: Addison-Wesley, Knuth, D E The Art of Computer Programming: Seminumerical Algorithms, ed a -a, Reading, MA: Addison-Wesley, Kogel, T și Myer, H "Heterogeneous MP-SoC: the solution to energy-efficient process processing signal," Proc a -a an Conf despre automatizarea designului, IEEE, pp - , Kontothanassis, L , Hunt, G , Stets, R , Hardavellas, N , Ciemiad, M , Parthasarathy, S , Meira, W , Dwarkadas, S și Scott, M VM-Based Memorie partajată pe rețele de acces la memorie la distanță cu latență scăzută, Proc a -a An Int'l Symp pe Computer Arch , ACM, pp - , Koren, I Computer Arithmetic Algorithms, Natick, MA: A K Peters, Koufaty, D și Marr, DT "Hyperthreading Technology in the Netburst Microarchitecture", IEEE Micro Magazine, voi , pp - martie-aprilie Kumar, R , Jouppi, N P și Tullsen, D M "Conjoined-Core Chip Multi-processing", Proc Simptomul Internațional al -lea despre Microarhitectură, IEEE , pp - , Lamport, L "How to Mac a Multiprocessor Computer That Correctly Executes Multiprocess Programs", IEEE Trans pe computere, voi C- , pp - , sept LaRowe, RP și Ellis, CS "Experimental Comparison of Memory Management Policies for NUMA Multiprocessors", ACM Trans on Computer Systems, voi , pp - , nov Lavagno, L "Systems on a Chip: The Next Electronic Frontier", IEEE Micro Magazine, voi , pp - , sept -oct Lawton, G "Will Network Processor Units Live up to Their Promise?", IEEE Computer Magazine, voi , pp - aprilie Lekkas, PC Network Processors: Architectures, Protocols, and Platforms, New York: McGraw-Hill, Levine, JR Linkers and Loaders, San Francisco: Morgan Kaufmann, Lista alfabetică de referințe Li, K și Hudak, R "Memory Coherence in Shared Virtual Memory Systems", ACM Trans on Computer Systems, voi , pp - , nov Lima, F, Carro, L , Velazco, R și Reis, R "Injecting Multiple Upsets in a SEU Tolerant Micro-Controller", Proc Al optulea atelier de testare on-line IEEE IEEE, p , iulie Lines, A "Asynchronous Interconnect for Synchronous SoC Design", IEEE Micro Magazine, voi , pp - , ian -feb Lu, H , Cox, A L , Dwarkadas, S , Rajamony, R și Zwaenepoel, IV "Software Distributed Shared Memory Support for Neregulate Applications", Proc a -a Conf despre Prin, și Practica programului paralel, pp - , iunie Lukasiewicz, J Silogistica lui Aristotel, ed a -a, Oxford: Oxford University Press, Lutz, J și Hasan, A "Coprocesor criptografic cu curbă eliptică bazată pe FPGA de înaltă performanță", Proc Int'l Conf pe Inf Teh : Codare și calcul, IEEE, pp - , Lyytinen, K și Yoo, Y "Probleme și provocări în calculul omniprezent", Comun al ACM, voi , pp - , dec MacKenzie, IS, Phan, R The Microcontroller, ed a -a Upper Saddle River, NJ: Prentice Hali, Mano, MM și Kime, CR Logic and Computer Design Fundamentals, a -a ed , Upper Saddle River, NJ: Prentice Hali, Martin, AJ,, Nystrom, M , Papadantonakis, K, Penzes, PL, Prakash, P , Wong, CG, Chang, J , Koh, KS, Lee, B , Ou, E , Pugh, J, Talvala, EV,, Tong, JT și Tura, A "The Lutonium: A Sub-Nanojoule Asynchronous Microcontroller", Proc Simptomul Internațional al nouălea despre circuite și sisteme asincrone IEEE, pp - , Martin, RP, Vahdat, AM, Culler, D, E, și Anderson, TE "Efectele de latență de comunicare, supraîncărcare și lățime de bandă într-o arhitectură de cluster", Proc a -a An Int'l Symp pe Computer Arch , ACM, pp - , Mayhew, D și Krishnan, V "PCI Express and Advanced Switching: Evolutionary Path to Building Next Generation Interconnects", Proc al ll-lea simptom pe High Perf Interconexiuni IEEE, pp - aug Mazidi, MA, McKinlay și Mazidi, JG Microcontroller and Embedded Systems Upper Saddle River, NJ: Prentice Hali, Mazidi, MA și Mazidi, JG The x IBM PC and Compatible Computers, a -a ed , Upper Saddle River, NJ: Prentice Hali, McKnight, LW, Howison, J și Bradner, S "Wireless Grids", IEEE Internet Computing, voi , pp - iulie-aug McKusick, M K, Bostic, K, Karels, M și Quarterman, JS "The Design and Implementation of the BSD Operating System", Reading, MA: Addison-Wesley, McKusick, MK, Joy, IV N , Leffler, SJ și Fabry, RS "Un sistem de fișiere rapid pentru UNIX", ACM Trans on Computer Systems, voi , pp - , aug Capitolul Bibliografie McNairy, C și Soltis, D "Itanium Processor Microarchitecture", IEEE Micro Magazine, voi , pp - , martie-aprilie Min, R , Jone, W -Ben și Ni, Y "Location Cache: A Low-Power L Cache System", Proce Int'l Symp despre electronică și design de putere redusă, IEEE, pp - , aug Messmer, H -P The Indispensable PC Hardware Book, a patra ed Reading, MA: Addison-Wesley, Moudgill, M , and Vassiliadis, S Precise Interrupts, IEEE Micro Magazine, voi , pp - februarie Mullender, SJ, and Tanenbaum, AS "Immediate Files", Software - Practice and Experience, voi , pp - , Nesbit, KJ și Smith, JE "Data Cache Prefetching Using a Global History Buffer", Proc Simp pe High Perf Computer Arch , IEEE, pp - , Ng, W, "Advances in Disk Technology: Performance Issues", IEEE Computer Magazine, voi , pp - , mai Nickolls, J , Madar, LJ III, Johnson, S , Rustagi, V , Unger, K și Choudhury, M "Calisto: A Low-Power Single-Chip Multiprocessor Communications Platform", IEEE Micro Magazine , voi , pp - , martie Norton, P și Goodman, J Inside the PC, ed a -a, Indianapolis, IN: Sams, Nuli, L și Lobur, J Elementele esențiale ale organizării și arhitecturii computerelor, Sudbury, MA: Jones și Bartlett, O'Connor, JM, and Tremblay, M "Picojava-I: The Java Virtual Machine in Hardware", IEEE Micro Magazine, voi , pp - , martie/aprilie Organick, E The MULTICS System, Cambridge, MA: MIT Press, Oskin, M , Chong, F T și Chuang, IL "A Practicai Architecture for Reliable Quantum Computers", IEEE Computer Magazine, vol , pp - , ian Ouadjaout, S, și Houzet, D "Easy SoC Design with VCI SystemC Adapters", Proc Digital System Design, IEEE, pp - , Papaefstathiou, L, Nikolaou, N,A, Doshi, B și Grosse, E Network Processors for Future High-End Systems and Applications, IEEE Micro Magazine, voi , pp - , sept -oct Papamarcos, M și Patel , J "A Low Overhead Coherence Solution for Multiprocessors with Private Cache Memories", Proc a -a Ann Int'l Symp pe Computer Arch , ACM, pp - , Parikh, D, Skadron, K , Zhang, Y și Stan, M Power-Aware Branch Prediction: Characterization and Design, IEEE Trans pe computere, voi , pp - , feb Patterson, D A "Reduced Instruction Set Computers", Comun al ACM, voi , pp - ian Lista alfabetică de referințe Patterson, D, A , Gibson, G și Katz, R "A case for redundant arrays of inexpensive disks (RAID)", Proc ACM SIGMOD Int'l Conf despre managementul datelor, ACM, pp - , Patterson, D, A și Hennessy, JL Computer Organization and Design, a treia ed , San Francisco, CA: Morgan Kaufmann, Patterson, D A , and Sequin, C H "A VLSI RISC", IEEE Computer Magazine, voi , pp - sept Paul, RP SPARC Architecture, Assembly Language, Programming, and C, Englewood Cliffs, NJ: Prentice Hali, Pfister, G F In Search of Clusters, a doua ed , Upper Saddle River, NJ: Prentice Hali, Popescu, BC, Steen, M Van și Tanenbaum, AS "A Security Architecture for Object-Based Distributed Systems", Proc Cea de-a -a aplicație anuală de securitate informatică Conf , ACM, pp - , Pountain, D "Pentium: Mai mult RISC decât CISC", Byte, voi , pp - , sept Price, D, "A History of Calculating Machines", IEEE Micro Magazine, voi , pp - , februarie Radin, G, "Minicomputerul ", Computer Arch Știri, voi , pp - , martie Raman, SK, Pentkovski, V și Keshava, J, "Implementarea extensiilor SIMD de streaming pe procesorul Pentium III", IEEE Micro Magazine, voi , pp - iulie-aug Ravikumar, CP "Arhitecturi multiprocesoare pentru aplicații de sistem încorporat pe cip", Proc a -a Conf Internațională despre VLSI Design, IEEE, pp - , ian Ritchie, DM și Thompson, K "The UNIX Time-Sharing System", Commun al ACM, voi , pp - , iulie Robinson, GS "Toward the Age of Smarter Storage", IEEE Computer Magazine, voi , pp - , dec Rosenblum, M, și Ousterhout, JK "Proiectarea și implementarea unui sistem de fișiere structurat în jurnal", Proc Al treisprezecelea simptom despre principiile sistemului de operare, ACM, pp - , Roth, C, H, Fundamentals of Logic Design, ed a -a, Florence, KY: Thomson Engineering, Russinovich, ME și Solomon, DA Microsoft Windows Internals, ed a -a, Redmond, WA: Microsoft Press, Rusu, S,, Muljono, H, and Cherkauer, B "Itanium Processor M", IEEE Micro Magazine, voi , pp - , martie-aprilie Saha, D și Mukheijee, A "Pervasive Computing: A Paradigm for the st Century", IEEE Computer Magazine, voi , pp - martie Capitolul Bibliografie Sakamura, K "Making Computers Invisible", IEEE Micro Magazine, voi , pp - , Saloman, D Assemblers and Loaders, Englewood Cliffs, NJ: Prentice Hali, Scales, DJ, Gharachorloo, K și Thekkath, CA "Shasta: O abordare cu costuri reduse doar pentru software pentru sprijinirea memoriei partajate cu granulație fină", Proc al -lea Int'l Conf pe Arh Suport pentru Prog lung și operă Syst , ACM, pp - , Scheible, JP "A Survey of Storage Options", IEEE Computer Magazine, voi , pp - , dec Seltzer, M , Bostic, K , McKusick, MK și Staelin, C "An Implementation of a Log-Structured File System for UNIX", Proc Iarna USENIX Technical Conf , pp - , Shanley, T , and Anderson, D PCI System Architecture, a -a ed Reading, MA: Addison-Wesley, Shriver, B și Smith, B The Anatomy of a High-Performance Microprocessor: A Systems Perspective, Los Alamitos, CA: IEEE Computer Society, Sima, D "Superscalar Instruction Issue", IEEE Micro Magazine, vol , pp - , sept /oct Sima, D , Fountain, T și Kacsuk, P Advanced Computer Architectures: A Design Space Approach, Reading, MA: Addison-Wesley, Slater, R Portraits in Silicon, Cambridge, MA: MIT Press, Snir, M , Otto, SW, Huss-Lederman, S , Walker, DW și Dongarra, J MPI: The Complete Reference Manual, Cambridge, MA: MIT Press, Sohi, GS, and Roth, A "Speculative Multithreaded Processors", IEEE Computer Magazine, voi , pp - , aprilie Solari, E și Congdon, B PCI Express Design & System Architecture, Research Tech, Inc , Solari, E și Willse, G PCI și PCI-X Hardware și Software, a -a ed , San Diego, CA: Annabooks, Stallings, W Computer Organization and Architecture, ed a VI-a Upper Saddle River, NJ: Prentice Hali, Stenstrom, P , Hagersten, E , Lilja, DJ, Martonosi, M și Venugopal, M Trends in Shared Memory Multiprocessing, IEEE Computer Magazine, voi , pp - , dec Stets, R , Dwarkadas, S , Hardavellas, N , Hunt, G , Kontothanassis, L , Parthasarathy, S și Scott, M "CASHMERE- L: Software Coherent Shared Memory on Clustered Remote Write Rețele, Proc al -lea Symp despre principiile sistemelor de operare, ACM, pp - , Suh, T , Lee, H -HS, Blough, DM "Integrating Cache Coherence Protocols for Heterogeneous Multiprocessor Systems, Part ", IEEE Micro Magazine, voi , pp - , iulie Lista alfabetică de referințe Summers, C K ADSL: Standarde, implementare și arhitectură, Bosa Raton, FL: CRC Press, Sunderram, V, B "PVM: A Framework for Parallel Distributed Computing", Concurrency: Practice and Experience, voi , pp - , dec Swan, RJ, Fuller, SH și Siewiorek, DP "Cm*-A Modular Multiprocessor", Proc NCC, pp - , Tan, WM Developing USB PC Peripherals, San Diego, CA: Annabooks, Tanenbaum, AS "Computer Networks", Upper Saddle River, NJ: Prentice Hali, Tanenbaum, AS "Implicații ale programării structurate pentru arhitectura mașinilor", Comun al ACM, voi , pp - , mar Tanenbaum, AS Sisteme de operare: proiectare și implementare Upper Saddle River, NJ: Prentice Hali, Tanenbaum, AS și Woodhull, A, W Sisteme de operare: proiectare și implementare Upper Saddle River, NJ: Prentice Hali, Thompson, K "Implementarea UNIX", Beli Syst Teh J , voi , pp - iulie-aug Treleaven, P "Control-Driven, Data-Driven, and Demand-Driven Computer Architecture", Parallel Computing, voi , Tremblay, M și O'connor,} M "UltraSPARC I: A Four-Issue Processor Supporting Multimedia", IEEE Micro Magazine, voi , pp - , aprilie Triebel, WA Procesorul , și Pentium, Upper Saddle River, NJ: Prentice Hali, Tuck, N și Tullsen, DM "Initial Observations of the Simultaneous Multi-threading Pentium Processor", Proc a -a Conf Internațională pe Paralel Arch și Tehnici de compilare, IEEE, pp - , Unger, SH "A Computer Oriented Toward Spațial Problems", Proc IRE, voi , pp - , Vahalia, U UNIX Internals, Upper Saddle River, NJ: Prentice Hali, Vahid, F "The Softening of Hardware", IEEE Computer Magazine, voi , pp - , aprilie Van Steen, M , Homburg, PC și Tanenbaum, AS "The Architectural Design of Globe: A Wide-Area Distributed System", IEEE Concurrency, voi , pp - , ianuarie-martie Vetter, P , Goderis, D , Verpooten, L și Granger, A "Systems Aspects of APON/ VDSL Deployment", IEEE Commun Magazine, voi , pp - , mai Weaver, DL și Germond, T The SPARC Architecture Manual, Version , Englewood Cliffs, NJ: Prentice Hali, Weiser, M "The Computer for the st Century", IEEE Pervasive Computing, voi , pp - , ian -martie ; publicat inițial în Scientific American, sept Wilkes, M V Computers Then and Now, J ACM, voi , pp - ian Capitolul Bibliografie Wilkes, M V "The Best Way to Design an Automatic Calculating Machine", Proc Manchester Univ Computer Inaugural Conf , Wilson, J "Challenges and Trends in Processor Design", IEEE Computer Magazine, voi , pp - , ian Wilson, P "Floating-Point Survival Kit", Byte, voi , pp - , martie Wolf, W "The Future of Multiprocessor Systems-on-Chips", Proc -a An Conf despre automatizarea designului, IEEE, pp - , anexa a numere binare Aritmetica folosită în calculatoare este diferită de aritmetica cu care suntem obișnuiți cu toții În primul rând, computerele operează cu numere a căror precizie este finită și fixă În al doilea rând, majoritatea computerelor nu folosesc zecimalul, ci sistemul de numere binar Aceste două subiecte sunt tratate în această anexă Numerele finale de precizie Când oamenii fac aritmetică, nu le pasă câte zecimale ocupă un anumit număr Fizicienii, de exemplu, pot calcula că există electroni IO în univers și nu le pasă că înregistrarea completă a acestui număr necesită de zecimale Problema lipsei de hârtie pentru a nota numărul nu se pune niciodată Cu computerele, lucrurile stau altfel Majoritatea computerelor au o cantitate fixă de memorie disponibilă pentru stocarea numerelor, în funcție de momentul în care computerul a fost lansat Cu efort, programatorul va putea reprezenta numere de două, trei sau mai multe ori mai mari decât dimensiunea memoriei, dar acest lucru nu schimbă natura problemei Memoria computerului este limitată, așa că ne putem ocupa doar de numere care pot fi reprezentate într-un număr fix de cifre Astfel de numere sunt numite numere de precizie finită Luați în considerare o serie de numere întregi pozitive care pot fi scrise ca trei zecimale fără virgulă și fără semn Această serie include exact de numere: OOO, , , , , Cu această restricție, este imposibil de exprimat anumite tipuri de numere Aceasta include: + numere mai mari de ; + numere negative; + fracții; + numere iraționale; + numere complexe Una dintre proprietățile mulțimii tuturor numerelor întregi este că este închisă în ceea ce privește operațiile de adunare, scădere și înmulțire Cu alte cuvinte, pentru fiecare pereche de numere întregi i și j, numerele i + j, i - j și ixj sunt de asemenea numere întregi Seria de numere întregi nu este închisă sub diviziune deoarece există valori i și y pentru care i/j nu este exprimat ca număr întreg (de exemplu, / sau / ) Numerele de precizie finită nu sunt închise în toate cele patru operații Iată exemple de operații pe numere zecimale din trei cifre: Anexa A Numere binare + Număr prea mare: + = + număr negativ: - = - + Număr prea mare: x = + Nu este un întreg: / = , Abaterile pot fi împărțite în două clase: operații al căror rezultat este mai mare decât cel mai mare număr al seriei (eroare de depășire) sau mai mic decât cel mai mic număr al seriei (eroare de depășire) și operațiuni al căror rezultat nu este prea mic sau prea mare, dar pur și simplu nu este un rând de membru Dintre cele patru exemple date, primele trei aparțin clasei întâi, iar al patrulea clasei a doua Întrucât memoria calculatorului este limitată și computerul trebuie să efectueze operații aritmetice pe numere de precizie finită, din punctul de vedere al matematicii clasice, rezultatele anumitor calcule se dovedesc a fi incorecte Eroarea în acest caz este doar o consecință a naturii finite a reprezentării numerelor într-un dispozitiv de calcul Unele computere au suport hardware încorporat pentru detectarea erorilor de depășire Algebra numerelor de precizie finită este diferită de algebra obișnuită Ca exemplu, luați în considerare legea asociației a + (b - c) == (a + b) - c Calculăm ambele părți ale expresiei pentru a = , b = și c = În partea stângă, calculăm mai întâi valoarea (h - c) Este egal cu Apoi adunăm acest număr la a și obținem Pentru a calcula partea dreaptă, mai întâi calculăm (a + b) Numerele întregi pe biți vor depăși Rezultatul va depinde de computer, dar nu va fi egal cu Scăderea a din altceva decât nu va avea ca rezultat Legea asocierii este invalidă Ordinea în care sunt efectuate operațiile este importantă Un alt exemplu este legea distributivă: ax(b- c) = ax b- ax a Să calculăm ambele părți ale expresiei pentru a = , d = us = În partea stângă, x = În partea dreaptă, nu se obține , deoarece rezultatul operației axh depășește seria Pe baza acestor exemple, s-ar putea concluziona că computerele sunt complet nepotrivite pentru efectuarea aritmeticii Concluzia este, desigur, greșită, dar aceste exemple arată clar cât de important este să înțelegem cum funcționează un computer și să fii conștient de limitările acestuia Sisteme numerice poziționale Sisteme numerice poziționale Un număr zecimal obișnuit constă dintr-un șir de zecimale și uneori un punct zecimal (virgulă) Forma generală a înregistrării este prezentată în fig A Zece este ales ca bază de exponențiere (și se numește baza sistemului numeric) deoarece folosim cifre În computere, este mai convenabil să se ocupe de alte baze ale sistemului numeric Cele mai importante sunt , și Sistemele numerice corespunzătoare sunt numite binar, octal și hexazecimal Sute Zeci Unități Zeci Sutimi Mii dn d di d d- d d- dk Număr = Z djxlO i= -k Orez A Forma generală a numărului zecimal Sistemul de numere de bază k necesită k caractere diferite pentru a reprezenta cifrele de la la k - Numerele zecimale sunt construite din cifre zecimale: Numerele binare, pe de altă parte, sunt construite din doar două cifre binare: Numerele octale sunt formate din opt cifre: Numerele hexazecimale necesită cifre Aceasta înseamnă că avem nevoie de personaje noi Pentru a indica numerele care urmează după nouă, se obișnuiește să se folosească litere mari latine de la A la F Astfel, numerele hexazecimale sunt construite din următoarele numere: A B C D E F O cifră binară (adică sau ) este denumită în mod obișnuit bit Pe fig A Numărul zecimal este reprezentat în sisteme de notație binar, octal și hexazecimal Numărul B este evident hexazecimal, deoarece caracterul B apare doar în numere hexazecimale Iar numărul poate fi scris în oricare dintre cele patru sisteme numerice Pentru a evita ambiguitatea, trebuie să folosiți un index pentru a indica baza sistemului numeric În tabel A O serie de numere întregi nenegative este reprezentată în fiecare dintre cele patru sisteme numerice Anexa A Numere binare (r) X despre I x + x + x (r) + x + x (r) + x + x + x + x + x + x ° m * + + + + + + + + + + f § | § x + x + x + x ° f § ș + + + O O CD § I § X + X + X + X ° la Ș + + + D FO L L L Î x + x + x ° q Ș + + si X b f Orez A Numărul în sisteme de numere binar, octal și hexazecimal Tabelul A Numerele zecimale și echivalentele lor binare, octale și hexazecimale Decimal Binar Octal Hexazecimal A V C D E F Conversia numerelor dintr-un sistem numeric în altul Decimal Binar Octal Hexazecimal E ZS A SE RĂU Conversia numerelor dintr-un sistem numeric în altul Conversia numerelor din octal în hexazecimal sau binar și înapoi este ușoară Pentru a converti un număr binar în octal, trebuie să-l împarți în grupuri de trei biți, cei trei biți imediat din stânga punctului binar formând un grup, următorii trei biți din stânga acelui grup formând al doilea grup și așa mai departe Fiecare grup de trei biți poate fi convertit într-o cifră octală cu o valoare de la la (vezi primele rânduri din Tabelul A ) Pentru a completa grupul de până la trei biți, trebuie să adăugați unul sau două zerouri în față Convertirea de la octal la binar este, de asemenea, banală Fiecare cifră octală este pur și simplu înlocuită cu un număr echivalent din cifre Conversia de la hexazecimal la binar este în esență aceeași cu conversia de la octal la binar, doar fiecare cifră hexazecimală corespunde unui grup de patru biți, nu trei Pe fig A oferă exemple de transformări de la un sistem la altul Conversia zecimală în binară se poate face în două moduri diferite Prima metodă decurge direct din definiția numerelor binare Din acel număr se scade cea mai mare putere cu două mai puțin decât numărul Aceeași operație se efectuează cu diferența rezultată Când un număr este extins în puteri de doi, numărul binar poate fi obținut după cum urmează Unitățile sunt plasate în acele poziții care corespund puterilor primite de doi și zerouri - în toate celelalte poziții A doua modalitate este de a împărți numărul la Coeficientul este scris direct sub numărul inițial, iar restul ( sau ) este scris lângă cât Același lucru se face și cu coeficientul rezultat Procesul se repetă până când rămâne Rezultatul ar trebui să fie două coloane de numere - private și oc Anexa A Numere binare Tatkov Un număr binar poate fi citit din coloana de reziduuri de jos în sus Pe fig A arată cum are loc conversia de la zecimal la binar Exemplul Număr hexazecimal ÎN număr binar număr octal Exemplul Număr hexazecimal ÎN ÎN CU A număr binar număr octal Orez A Z Exemple de conversie din octal în binar și din hexazecimal în binar Privat Rest unsprezece Orez A Convertirea numărului zecimal în binar prin împărțire secvențială (de sus în jos) De exemplu, împărțit la dă , iar restul este Restul este scris în rândul de mai jos Numere binare negative Numerele binare pot fi convertite în zecimale în două moduri Prima modalitate este să însumăm puterile a doi care corespund celor biți din numărul binar De exemplu: = + + = + + = În a doua metodă, numărul binar este scris vertical, un bit pe linie, cu bitul din stânga în jos Rândul de jos este rândul , apoi vine rândul și așa mai departe Numărul zecimal este construit pe această coloană Să notăm mai întâi șirul Elementul șir n este format din de două ori elementul șir n - plus șirul de biți n ( sau ) Elementul primit în rândul de sus va fi răspunsul Metoda este ilustrată în fig A nevoie de aici Orez A Conversia numărului binar în zecimal prin dublarea succesivă de jos în sus În fiecare linie următoare, valoarea liniei anterioare este dublată și se adaugă bitul corespunzător De exemplu, este înmulțit cu și se adaugă bitul șirului corespunzător (în acest caz ) Rezultatul este Conversia de la zecimal la octal sau hexazecimal se poate face fie prin conversia mai întâi în binar și apoi în sistemul dorit, fie prin scăderea puterilor de sau Numerele binare negative De-a lungul istoriei computerelor digitale, sisteme diferite au fost folosite pentru a reprezenta numerele negative Primul dintre acestea se numește sistem semnat Într-un astfel de sistem, bitul din stânga este bitul semn Anexa A Numere binare ( este plus, este minus), iar biții rămași arată valoarea absolută a numărului În cel de-al doilea sistem, care se numește complement, există și un bit de semn ( - plus, - minus) Pentru a face un număr negativ, trebuie să înlocuiți fiecare cu un zero și fiecare zero cu unul Acest lucru este valabil și pentru bitul de semn Sistemul complementului unu este deja învechit Al treilea sistem, complementul în doi, conține bitul de semn ( pentru plus, pentru minus) Negarea unui număr are loc în două etape În primul rând, fiecare este schimbat la zero și fiecare zero la unu (ca în sistemul complementului unu) Apoi se adaugă unul la rezultat Adunarea binară funcționează exact ca și adunarea zecimală, cu excepția faptului că transferul este efectuat dacă suma este mai mare decât și nu mai mare de De exemplu, luați în considerare conversia numărului în forma complementului a doi: + Numărul + : + Numărul - în sistemul complementului unu: + Numărul - în sistemul complementului a doi: Dacă un transport trebuie făcut din partea din stânga, acesta este pur și simplu aruncat În al patrulea sistem, care pentru numerele de m biți se numește sistem cu o deplasare de m , numărul este reprezentat ca suma acestui număr și I De exemplu, pentru un număr de biți (m = ), acesta este un sistem compensat cu , în care numărul este stocat ca sumă a numărului original și Prin urmare, - devine - + = , iar acest număr (- ) este reprezentat de numărul binar de biți ( ) Numerele de la - la + sunt exprimate ca numere de la la (toate putând fi scrise ca un număr pozitiv de biți) Rețineți că acest sistem corespunde sistemului de complement a doi cu bitul de semn inversat În tabel A oferă exemple de numere negative în toate cele patru sisteme În sistemele cu semn și complement, există două reprezentări ale lui zero: + și - Această situație nu este de dorit Într-un sistem de complement a doi, nu există o astfel de problemă, deoarece aici plus zero este întotdeauna plus zero Dar în acest sistem există o altă caracteristică Un set de biți format dintr-un urmat de toate -urile este propriul său complement Ca rezultat, seria de numere pozitive și negative nu este simetrică - există un număr negativ fără unul pozitiv corespunzător Luăm în considerare aceste probleme deoarece dorim să avem un sistem de codare în care: + există o singură reprezentare a lui zero; + numărul numerelor pozitive este egal cu numărul celor negative Aritmetică binară Tabelul A- Numere negative de biți în patru sisteme diferite N zecimal N binar -N cu semn -N complement la unu -N complement la doi -N compensat cu Nu există Nu există Nu există Faptul este că orice serie de numere cu un număr egal de numere pozitive și negative și doar un zero conține un număr impar de membri, în timp ce m biți implică un număr par de combinații de biți În orice caz, fie o combinație de biți va fi redundantă, fie o combinație va lipsi Un model de biți suplimentar poate fi folosit pentru a reprezenta - , pentru un număr negativ mare sau pentru orice altceva, dar va crea întotdeauna inconveniente Aritmetică binară Figura A ilustrează adunarea binară Adunarea a două numere binare începe cu bitul din dreapta Biții corespunzători din primul și al doilea termen sunt însumați Purtarea se efectuează cu o poziție la stânga, ca în aritmetica zecimală În aritmetica complementului cuiva, bitul de transport după adăugarea biților din stânga Anexa A Numere binare adăugat la partea din dreapta Acest proces se numește round-robin În aritmetica complementului a doi, transportul rezultat din adăugarea biților din stânga este pur și simplu aruncat Exemple de operații aritmetice asupra numerelor binare sunt prezentate în fig A Primul termen Al doilea termen + * + * Suma Transfer Orez A Tabel de adunare pentru numere binare zecimale Plus Plus numere de până la unu până la doi + (- ) + Transfer aruncat Orez A Adăugarea în Complementul Unu și Sistemul Complement a Doi Dacă primul și al doilea termen au semne opuse, nu va apărea nicio eroare de depășire Dacă au același semn și rezultatul este semnul opus, atunci a apărut o eroare de depășire și rezultatul este incorect Atât în aritmetica complementului unu cât și în complementul a doi, are loc o depășire dacă și numai dacă o transferare în bitul de semn diferă de o depășire a bitului de semn În majoritatea computerelor, transferul de la bitul de semn este păstrat, dar transportul la bitul de semn nu este vizibil din rezultat, așa că de obicei este introdus un bit de overflow special Întrebări și sarcini Convertiți următoarele numere în binar: , , Convertiți numărul binar în zecimal, octal și hexazecimal Care dintre șirurile de caractere BED, CAB, DEAD, DECADE, ACCEDED, BAG, DAD sunt numere hexazecimale? Exprimați numărul zecimal în sisteme numerice cu baze de la la Întrebări și sarcini Câte numere întregi pozitive diferite pot fi exprimate în k cifre folosind numere cu baza r? Majoritatea oamenilor pot număra cu degetele până la Cu toate acestea, informaticienii sunt capabili de mai mult Imaginează-ți că fiecărui deget îi corespunde o cifră binară Fie ca degetul întins să însemne și degetul îndoit Cât de departe putem număra folosind degetele ambelor mâini? Dar degetele de la mâini și de la picioare? Imaginați-vă că degetul mare din stânga este bitul semn pentru numerele complementului a doi Câte numere pot fi exprimate în acest fel? Efectuați următoarele calcule pe numerele complement pe biți: + + - - Efectuați aceleași calcule pe sistemul complementului unu Următoarele sunt sarcini pentru adăugarea numerelor binare de biți într-un sistem de complement a doi Pentru fiecare sumă, setați: ) Dacă bitul semn al rezultatului este egal cu unu ) Sunt cei mai puțin semnificativi trei biți zero ) Dacă a existat un preaplin + + + + + Numerele zecimale semnate formate din n cifre pot fi reprezentate în n + cifre fără semn Numerele pozitive au un în cifra din stânga Numerele negative se obțin prin scăderea fiecărei cifre din De exemplu, numărul negativ pentru este Astfel de numere se numesc numere de complement nouă Ele sunt asemănătoare numerelor binare cu complementul unu Exprimați următoarele numere ca numere complementare din cifre: , - , , - , - , Formulați o regulă pentru adăugarea numerelor de complement nouă și apoi efectuați următoarele calcule: + + + + Anexa A Numere binare Sistemul complementului la zece este similar cu sistemul complementului la doi Un număr negativ în sistemul de complement zece se obține prin adăugarea unui număr la numărul de complement nouă corespunzător, ignorând purtarea Care este regula pentru adunare în sistemul complementului zece? Realizați tabele de înmulțire pentru numerele sistemului numeric cu baza Înmulțiți numerele binare și UN Scrieți un program care ia un număr zecimal cu semn ca șir de caractere ASCII ca intrare și care scoate reprezentarea numărului în binar octal, hexazecimal și complement a doi Scrieți un program care ia ca intrare șiruri de de zerouri și uni ASCII Fiecare linie reprezintă un număr binar de de biți pe un sistem de complement a doi La ieșire, programul ar trebui să scoată suma lor ca un șir de de caractere ASCII de zero și unu Anexa B Numere în virgulă mobilă Gama de numere utilizate în diferite calcule este foarte mare De exemplu, calculele astronomice pot include masa unui electron ( x IO' grame) și masa Soarelui ( x IO grame) Intervalul de numere aici depășește IO Aceste numere pot fi reprezentate astfel: , Toate calculele trebuie să stocheze de cifre la stânga punctului zecimal și de cifre la dreapta acesteia Acest lucru va da de cifre semnificative în rezultate Pe un computer binar, aritmetica cu precizie multiplicată poate fi utilizată pentru a oferi suficientă semnificație Cu toate acestea, nu putem determina masa Soarelui nici măcar la cinci cifre semnificative, cu atât mai puțin În realitate, este aproape imposibil să facem măsurători cu o precizie de de cifre Ar fi posibil să stocați toate rezultatele intermediare cu o precizie de de biți semnificativi și să renunțați la sau de biți înainte de afișarea rezultatelor finale, dar procesorul și memoria ar petrece prea mult timp pentru asta Avem nevoie de un sistem de reprezentare a numerelor în care intervalul de numere exprimat este independent de numărul de cifre semnificative În această anexă, vom descrie un astfel de sistem Se bazează pe reprezentarea exponențială a numerelor, care este folosită în fizică, chimie și inginerie mecanică Principii în virgulă mobilă Numerele pot fi exprimate în următoarea formă exponențială convențională: n \u d / x e, unde f se numește fracție sau mantisă, iar e (fie că este un întreg pozitiv sau negativ) se numește exponent Versiunea computerizată a acestei reprezentări se numește reprezentare în virgulă mobilă Iată exemple de numere într-o astfel de notație: , = , x = , x ° , = , x IO' = , x IO' = , x IO = , x IO Intervalul este determinat de numărul de cifre din exponent, iar precizia este determinată de numărul de cifre din mantise Există mai multe moduri de a prezenta Anexa B Numere în virgulă mobilă din acest sau acel număr, astfel încât o formă este aleasă ca standard Pentru a explora proprietățile acestei reprezentări, luați în considerare o reprezentare a lui R cu o mantise cu trei cifre semnate în intervalul , SYS I PUSH CX I BP: : CC ■ > P ■ - => ADD SP, I PUSH hw I SI : IP: : c:PC SUB CX AX I PUSH STDOUT ! Dl: start + c PUSH CX I PUSH WRITE E SYS I ADD SP, I SUB CX AX hw PUSH CX ■ > Bună lume\n PUSH EXIT ! hw + = : c c f f Hello World SYS SECT DATE hw: ASCII "Hello World" ' de: BYTE I A b Orez ÎN Codul sursă al programului în limbaj de asamblare (a); fereastra de urmărire cu informații despre progresul programului (b) Acum să aruncăm o privire rapidă la conținutul celor șapte ferestre copil prezentate în Fig B , b În rândul de sus sunt trei ferestre - două mari și una mai mică Fereastra din stânga sus arată conținutul procesorului, și anume, valorile curente ale segmentului (CS, DS, SS și ES), aritmetice (AH, AL, AX) și ale altor registre În fereastra din mijloc din rândul de sus, este indicat conținutul stivei - zona de memorie destinată stocării valorilor temporare Fereastra din dreapta sus afișează un fragment al programului în limbaj de asamblare; săgeata indică comanda care este în curs de executare Pe măsură ce programul rulează, această săgeată se deplasează în mod natural de la o instrucțiune la alta Interpretul poate lucra într-un astfel de mod în care o singură apăsare a tastei Enter are ca rezultat executarea unei comenzi și actualizarea corespunzătoare a tuturor ferestrelor Astfel, un program scris în limbaj de asamblare poate fi executat într-un mediu de simulator la o viteză care vă permite să înțelegeți ce se întâmplă Procesor Fereastra de sub fereastra din stânga sus definește conținutul stivei de apeluri subrutine, care este goală în acest caz Mai jos sunt comenzile proprii ale trasorului Fereastra din dreapta acestor două ferestre este pentru mesaje de intrare, ieșire și de eroare Fereastra cea mai de jos afișează conținutul părții din memorie Despre toate aceste ferestre vom vorbi în detaliu mai târziu, dar deocamdată este important să ne facem o idee generală despre ce informații le permite utilizatorului să vadă trasorul: codul sursă al programului, conținutul registrelor mașinii, informații despre starea programului executabil Pe măsură ce fiecare comandă ulterioară este rulată, conținutul ferestrei interpretorului este actualizat, astfel încât programatorul să poată înțelege procesul cât de detaliat dorește Procesor Orice procesor, inclusiv , are propria sa stare internă, care se referă la una sau alta informație critică Pentru a stoca și procesa aceste informații, procesorul are un set special de registre Cel mai important dintre acestea este registrul PC (Program Counter) Indică locația de memorie (adresa) care stochează următoarea instrucțiune în ordinea execuției O altă denumire pentru acest registru este IP (Instruction Pointer) Porțiunea din memoria principală care stochează următoarea instrucțiune în ordinea de execuție se numește segment de cod Capacitatea de memorie principală permisă suportată de procesorul este puțin peste MB, dar dimensiunea segmentului de cod este limitată la KB Începutul acestui segment într-o memorie de MB este definit în registrul CS (vezi Figura B ) Pentru a activa un nou segment de cod, este suficient să modificați valoarea registrului CS Pe lângă segmentul de cod, există un segment de date, care ocupă și KB și definește începutul datelor Pe fig B începutul datelor este determinat de registrul DS, al cărui conținut poate fi modificat dacă este necesar și, prin urmare, accesează datele care se află în afara segmentului curent Necesitatea registrelor CS și DS se datorează faptului că lățimea registrelor este de biți, ceea ce înseamnă că este imposibil să stocați adresele de de biți necesare pentru a accesa memoria de MB în ele De aceea au apărut segmentul de cod și segmentul de date Alte registre dețin date sau pointeri către date aflate în memoria principală Programele de asamblare accesează direct aceste registre Pe lângă registre, procesorul conține și alt hardware necesar funcționării, dar aceste componente sunt disponibile programatorului doar prin instrucțiuni Ciclul procesorului Munca procesorului (precum și a tuturor celorlalte computere) se reduce la executarea comenzilor într-o anumită secvență Procesul de executare a unei singure comenzi este împărțit în mai multe etape: Anexa B Programare în limbaj de asamblare Cu ajutorul registrului PC, comanda este selectată din segmentul de cod al memoriei Se adaugă unul la valoarea curentă a contorului programului Comanda selectată este decodificată Toate datele necesare executării comenzii sunt selectate din registrele de memorie și (sau) procesor Comanda este executată Rezultatele executării comenzii sunt stocate în memorie și (sau) registre Începe procesul de executare a următoarei comenzi (treceți la pasul ) Rularea unei comenzi este ca și cum rulați un program foarte mic În plus, unele mașini au o mică parte de software (numit firmware) pentru executarea instrucțiunilor Firmware-ul este discutat în detaliu în Capitolul Din punctul de vedere al unui programator asamblator, procesorul are registre Aceste registre îndeplinesc funcția de memorie scratch, cu care lucrează numeroase instrucțiuni; rezultatele stocate în ele se modifică foarte frecvent Toate aceste registre sunt prezentate în Fig LA Asemănarea dintre această figură și fereastra trasoare prezentată în fig ÎN AX Registre de uz general CS Registre de segment Segmentul codului AH AL IN HV BL DS Segment de date CX CH CL SS Segment de stivă DX DH DL ES Segment suplimentar Indicatori și indici Coduri de condiție SP Indicator de stivă SF ss O DI T SZ A R S steaguri de stare I Indicator de bază BP Indicator de instrucțiuni Indicele sursei SI - ІР Contor de comenzi PC^ DI Receiver index i C I C I Orez LA registre de procesor Procesor Registrele procesorului au o lățime de biți Nu există o singură pereche de registre complet identice din punct de vedere funcțional În același timp, unele dintre ele sunt similare în unele dintre caracteristicile lor și, prin urmare, sunt împărțite în mai multe grupuri, ceea ce este prezentat și în Fig LA Vom discuta acum despre aceste grupuri Registre de uz general Registrele AX, BX, CX și DX fac parte din grupul de registre de uz general Primul registru din acest grup, AX, se numește registru sumator Este folosit pentru a acumula rezultatele calculelor și adesea acționează ca un receptor al rezultatelor executării diferitelor comenzi Deși fiecare registru este capabil să îndeplinească multe sarcini diferite, rezultatele unor instrucțiuni (în special, instrucțiuni de multiplicare) sunt trimise implicit registrului AX Al doilea registru al acestui grup, BX, se numește registru de bază Prin programare, este în multe privințe similar cu registrul AX, dar există o diferență semnificativă Puteți scrie o adresă de memorie în BX și apoi executați o instrucțiune al cărei operand se află la acea adresă de memorie Cu alte cuvinte, BX poate conține un pointer către o zonă de memorie, dar AX nu Pentru a ilustra această afirmație, să comparăm două comenzi Prima echipa: MOV AX,BX Această comandă copiază conținutul BX în AX A doua comanda: MOV AX,(BX) Această instrucțiune copiază în AX conținutul cuvântului de memorie a cărui adresă este conținută în BX În primul exemplu, operandul sursă este conținut în registrul BX; al doilea exemplu conține un pointer către operandul sursă În ambele exemple, după cum puteți vedea, ambii operanzi sunt specificați pentru instrucțiunea MOV: sursă (sursă) și țintă (destinație) În acest caz, operandul țintă este specificat înaintea sursei Următorul registru de uz general, CX, se numește registru de contor Printre altele, este folosit pentru a stoca valorile contorului în timpul buclelor În timpul procesării instrucțiunii LOOP, valoarea din acest registru este automat decrementată cu unu De regulă, ciclurile se termină în momentul în care valoarea din registrul CX ajunge la zero Al patrulea registru din grupul de registre de uz general este registrul de date (DX) Împreună cu registrul AX, este utilizat la executarea comenzilor cu cuvinte cu lungime dublă ( de biți) În acest caz, cei biți superiori sunt stocați în DX, iar cei biți inferiori sunt stocați în AX Aici trebuie să facem o rezervare care de obicei numerele întregi de de biți sunt numite lungi Termenul dublu este folosit mai frecvent pentru valorile în virgulă mobilă pe de biți, dar uneori este folosit și pentru a se referi la valori întregi pe de biți În contextul nostru, nu va exista confuzie, deoarece nu vom discuta despre numerele în virgulă mobilă Fiecare registru de uz general poate fi considerat fie un singur registru de biți, fie o pereche de registre de biți Astfel, procesorul are opt registre de biți care sunt folosite Anexa B Programare în limbaj de asamblare la executarea comenzilor cu octeți și caractere Registrele incluse în toate celelalte grupuri nu pot fi împărțite în două părți de biți Unele comenzi folosesc întregul registru (de exemplu, AX), altele - doar o parte a acestuia (de exemplu, AL sau AH) Ca regulă generală, acele instrucțiuni care efectuează operații aritmetice folosesc de obicei registre întregi de biți, în timp ce cele care se ocupă de caractere se mulțumesc cel mai adesea cu registre de biți Rețineți că AL și AH nu sunt altceva decât numele celor două jumătăți ale registrului AX Când un nou număr de biți este scris în AX, jumătățile sale inferioare și superioare sunt plasate în AL și, respectiv, AH Interacțiunea registrelor AX, AH și AL poate fi ilustrată prin următoarea comandă: MOV AX Încarcă în registrul AX valoarea zecimală După finalizarea acestei instrucțiuni, valoarea se află în registrul octet AH, iar valoarea este în registrul octet AL Fie ca această comandă să fie urmată de alta: ADDB AH AL În acest caz, valoarea AL (adică ) este adăugată la valoarea registrului de octeți AH, iar valoarea rezultată devine Ca urmare a acestei operații, o nouă valoare este scrisă în registrul AX - , echivalent cu valoarea în sistemul numeric binar sau cu valoarea x x în sistemul numeric hexazecimal De regulă, două registre de octeți sunt interschimbabile Singura excepție este instrucțiunea MULB, timp în care unul dintre operanzi este întotdeauna stocat în registrul AL, care, împreună cu AH, este receptorul în acest caz La executarea instrucțiunii DIVB, dividendul este stocat în perechea de registre AH și AL Octetul inferior al registrului de contor CL este utilizat pentru a stoca numărul de cicluri la executarea instrucțiunilor de schimbare normală și ciclică Al doilea exemplu din secțiunea Exemple (acest exemplu este din programul GenReg s) arată unele proprietăți ale registrelor generale Registre pointer Al doilea grup de registre conține registre pointer și registre index Cel mai important registru din acest grup este stack pointer (SP) Stivele joacă un rol important în majoritatea limbajelor de programare Stiva este un segment de memorie care stochează anumite date asociate cu contextul programului executabil În mod obișnuit, atunci când o procedură este apelată, o porțiune a stivei este rezervată pentru a-și stoca variabilele locale, adresa la care se va întoarce când procedura se termină și o serie de alte date de control Adesea stiva asociată cu execuția unei proceduri se numește cadru stivă Când o procedură apelată anterior apelează o altă procedură, este alocat un cadru de stivă suplimentar, plasat de obicei imediat sub primul În consecință, atunci când toate procedurile ulterioare sunt apelate, noi cadre de stivă sunt alocate pentru fiecare dintre ele în ordine descrescătoare Nu întotdeauna, dar în cele mai multe cazuri, stivele cresc în jos Procesor supa de varza - de la adrese mari la cele mai mici Cu toate acestea, partea de sus a stivei se numește cea mai mică adresă Pe lângă variabilele locale, stivele stochează rezultatele temporare ale execuției Procesorul are o instrucțiune PUSH care împinge un cuvânt de biți în partea de sus a stivei Pentru a face acest lucru, mai întâi decrește valoarea registrului SP cu și apoi își stochează operandul la adresa către care indică acest registru după actualizare Instrucțiunea POP elimină cuvintele de biți din partea de sus a stivei în același mod - selectează valoarea situată în acest vârf și adaugă un doi la conținutul registrului SP Registrul SP, care indică partea de sus a stivei, poate fi schimbat cu comenzile PUSH, POP și CALL; în același timp, PUSH și CALL îi scad valoarea, iar POP, dimpotrivă, o crește Următorul registru din acest grup se numește indicatorul de bază (BP) De obicei, o adresă de pe stivă este scrisă în ea Spre deosebire de SP, care indică întotdeauna spre vârful stivei, BP poate indica oriunde pe stivă Cea mai obișnuită utilizare a registrului VR este de a indica începutul cadrului stivei procedurii curente; aceasta simplifică sarcina de a găsi variabilele locale Astfel, BP indică adesea spre partea de jos a cadrului stivei curent (cu alte cuvinte, către cuvântul din cadrul stivei cu cea mai mică valoare numerică), iar SP spre partea de sus (cuvântul din cadrul stivei cu cea mai mare valoare numerică ) Prin urmare, limitele cadrului actual al stivei sunt determinate de valorile registrelor pointerului BP și SP Acest grup are două registre de index: SI (Indice sursă) și DI (Index de destinație) În combinație cu VR, aceste registre sunt adesea folosite pentru a adresa date de pe stivă și, în combinație cu BX, pentru a calcula adresele de memorie Vom vorbi mai multe despre utilizarea acestor registre în secțiunea despre modurile de adresare Unul dintre cele mai importante registre, constituind un grup autosuficient, se numește indicatorul de instrucție; acest termen a fost introdus de Intel, în cazul general, un astfel de registru se numește program counter (PC) Instrucțiunile se referă la acesta pentru adresele segmentelor de cod din memorie Ciclul de execuție a instrucțiunii de către procesor începe cu preluarea instrucțiunii indicate de registrul PC Înainte de a executa comenzile ulterioare ale ciclului, se adaugă una la valoarea acestui registru Astfel, contorul de programe indică întotdeauna prima instrucțiune care urmează celei curente Registrul de pavilion, sau registrul de cod de condiție, este în esență un întreg set de registre, câte un bit: + Z - rezultat zero; + S - rezultat negativ (bit de semn); + V - rezultatul a generat un overflow; + C - rezultatul a generat un transfer; + A - transport de serviciu (de la bit ); + P este paritatea rezultatului Ceilalți biți din acest registru controlează diferite aspecte ale funcționării procesorului În special, bitul I activează întreruperi, iar bitul T activează modul de urmărire, care este utilizat pentru depanarea programelor În cele din urmă, bitul D reglează direcția Anexa B Programare în limbaj de asamblare operații cu șiruri Nu toți cei biți ai registrului flag sunt utilizați; biții neutilizați au o valoare fixă de zero Patru registre sunt alocate grupului de registre de segmente După cum vă amintiți, stiva, datele și codurile de instrucțiuni sunt stocate în diferite zone ale memoriei principale Registrele de segmente grupează aceste zone de memorie, numite segmente Registrele de segment includ registrul de segment de cod (CS), registrul de segment de date (DS), registrul de segment de stivă (SS) și registrul de segment extins (ES) De cele mai multe ori, valorile lor rămân neschimbate De fapt, segmentul de date și segmentul de stivă aparțin aceleiași zone de memorie, dar datele sunt stocate în partea de jos a acestui segment comun, iar stiva se află în partea de sus Vom discuta despre segmente mai detaliat în subsecțiunea "Organizarea și segmentele memoriei" din secțiunea "Memorie și adresare" Memorie și adresare Memoria procesorului este organizată destul de neobișnuit, ceea ce se explică prin combinația de memorie de megaoctet și registre de biți Cert este că într-o memorie cu o capacitate de MB sunt necesari de biți pentru a reprezenta o adresă Prin urmare, nu este posibil să stocați un pointer către un element de memorie într-un singur registru de biți Pentru a rezolva problema, memoria este împărțită în segmente de KB fiecare, iar adresele din aceste segmente se încadrează în biți În continuare, ne vom uita la arhitectura memoriei mai detaliat Organizarea și segmentele memoriei Memoria procesorului , care constă dintr-o matrice de octeți adresabili de biți, este folosită pentru a stoca comenzi, date și stiva Pentru a separa zonele de memorie utilizate în scopuri diferite, procesorul introduce conceptul de segmente, care sunt blocuri de memorie separate unele de altele Un astfel de segment în este format din de octeți consecutivi Există patru segmente în total: cod, date, stivă și suplimentar Segmentul de cod conține comenzile care alcătuiesc programele Conținutul registrului PC este întotdeauna interpretat ca adresa unui segment de cod din memorie Valoarea zero a PC-ului nu indică adresa zero absolută din memorie, ci cea mai mică adresă din segmentul de cod dat Segmentul de date stochează date de program inițializate și neinițializate Dacă registrul BX conține un pointer, acesta trebuie să indice segmentul de date Segmentul de stivă conține variabile locale și rezultate intermediare împinse pe stivă Adresele specificate în registrele SP și BP se referă întotdeauna la segmentul de stivă Segmentul suplimentar este un registru de segment auxiliar care poate fi plasat oriunde în memorie, după cum este necesar Fiecare dintre aceste segmente corespunde unuia dintre registrele de segment de biți: CS, DS, SS sau ES Adresa de început a segmentului este un întreg fără semn de de biți format prin deplasarea registrului de segment cu biți Memorie și adresare că la stânga și plasând patru zerouri în cele patru poziții libere din dreapta Prin urmare, registrele de segment dintr-un spațiu de adrese de de biți sunt întotdeauna exprimate ca multipli de Registrul de segment indică baza segmentului Adresele de segment sunt formate prin conversia unei valori de biți din registrul de segment într-o adresă reală de de biți prin adăugarea a patru biți zero la sfârșitul valorii și efectuând o compensare În cele din urmă, adresa absolută din memorie este setată prin înmulțirea valorii din registrul de segment cu și adăugarea offset-ului De exemplu, dacă valoarea lui DS este și BX este , atunci BX indică adresa x + = Cu alte cuvinte, pe baza valorii lui din registrul DS, puteți obține binarul de de biți adresa Adăugând la valoarea inițială a segmentului offset de biți (zecimal ), obținem adresa de de biți (zecimală) De fiecare dată când se accesează memoria, unul dintre registrele de segment este folosit pentru a forma adresa reală a memoriei Dacă o instrucțiune conține o adresă imediată fără nicio indicație a unui registru, acea adresă este considerată a fi în segmentul de date, iar registrul DS este utilizat pentru a determina baza acestui segment Adresa fizică este determinată prin adăugarea rezultatului operației anterioare la adresa specificată în comandă Adresa fizică din memoria de cod a următoarei instrucțiuni este setată prin deplasarea conținutului registrului CS cu patru biți și adăugarea la valoarea contorului programului Cu alte cuvinte, adresa reală de de biți este mai întâi calculată din valoarea registrului CS de biți, apoi se adaugă noua valoare de biți a PC-ului; rezultatul este o adresă absolută de de biți în memorie Segmentul de stivă este format din cuvinte de octeți, ceea ce înseamnă că doar un număr par poate fi stocat în indicatorul de stivă (SP) Stiva se umple în ordine de la cea mai mare adresă la cea mai mică Astfel, instrucțiunea PUSH decrește indicatorul stivei cu și apoi stochează operandul la adresa de memorie calculată din valorile SS și SP Instrucțiunea POP preia valoarea primită după operația PUSH și incrementează valoarea SP cu Acele adrese din segmentul de stivă care sunt sub limita determinată de registrul SP sunt considerate libere Prin urmare, curățarea stivei se face doar prin creșterea SP În practică, valorile registrelor DS și SS sunt întotdeauna aceleași, așa că un pointer de biți este suficient pentru a accesa o variabilă din segmentul comun de date și stivă Dacă valorile registrelor DS și SS ar fi diferite, la fiecare pointer ar trebui adăugat un al -lea bit - singura modalitate de a face distincția între pointerii către segmentul de date și către segmentul stivă În general, crearea unui segment separat de stivă de către dezvoltatorii de cipuri cu greu poate fi considerată justificată Dacă adresele din cele patru registre de segmente sunt îndepărtate, segmentele sunt împărțite, dar având în vedere cantitatea limitată de memorie disponibilă, nu este necesară divizarea acestora Cantitatea de cod de program după compilare este necunoscută Prin urmare, este cel mai eficient să plasați granița inițială a segmentului de date și a segmentului de stivă prin primul multiplu de Anexa B Programare în limbaj de asamblare după ultima comandă Această decizie implică faptul că segmentul de cod și segmentul de date nu vor folosi în niciun caz aceeași adresă fizică Adresarea Pentru a executa marea majoritate a comenzilor, sunt necesare date care sunt preluate fie din memorie, fie din registre oferă mai multe moduri de adresare pentru denumirea acestor date Multe instrucțiuni conțin doi operanzi, care în acest caz sunt de obicei numiți sursă (sursă) și țintă (destinație) Să luăm copia și să adăugăm comenzi ca exemplu: MOV AX IN ADD CX Primii operanzi din aceste instrucțiuni sunt destinațiile, iar al doilea operanzi sunt sursele (Ordinea lor nu este fundamentală; ar putea la fel de bine să fie inversată ) Evident, în acest caz, destinația este valoarea din stânga, adică valoarea suprascrisă ar trebui să fie situată în acest loc Prin urmare, operanzii țintă, spre deosebire de cei sursă, nu pot fi constante În decizia de proiectare inițială din , unul dintre operanzi, dacă există doi dintre ei în instrucțiune, trebuie să fi fost un registru Această cerință trebuia să facă distincția între instrucțiunile de procesare de octeți și de text pe baza faptului că registrul adresat este un registru de octeți sau un registru de cuvinte În prima versiune a procesorului, această regulă a fost respectată cu o strictețe incredibilă Nici măcar nu a fost posibil să se împingă o constantă pe stivă, deoarece în acest caz, nu ar exista niciun registru în niciunul dintre cei doi operanzi ai instrucțiunii În versiunile ulterioare, restricțiile au fost relaxate, dar principiul în sine a avut un anumit impact asupra designului procesorului În unele cazuri, unul dintre cei doi operanzi nu este menționat De exemplu, în instrucțiunea MULB, doar registrul AX poate juca rolul receptorului Există, de asemenea, instrucțiuni cu un singur operand Această categorie include, dar nu se limitează la, comenzi de creștere, schimbare și resetare În aceste instrucțiuni, cerința de a utiliza un registru ca operand nu se aplică și puteți distinge între instrucțiuni de procesare a textului și octet numai prin codurile de operare (adică tipuri de instrucțiuni) Procesorul acceptă patru tipuri de date de bază: octet, cuvânt ( octeți), cuvânt lung ( octeți) și BCD, care împachetează cifre zecimale într-un cuvânt Ultimul tip nu este acceptat de interpret O adresă de memorie corespunde întotdeauna unui octet, dar în cazul unui cuvânt obișnuit sau lung, există și o referire implicită la locațiile de memorie imediat deasupra octetului specificat De exemplu, cuvântul de la adresa ocupă locațiile de memorie și Cuvântul lung de la adresa ocupă locațiile , , și Procesorul este invers Memorie și adresare ordinea octetilor (little endian); aceasta înseamnă că partea inferioară a cuvântului este stocată la adresa cea mai joasă Într-un segment de stivă, cuvintele trebuie plasate la adrese egale Combinația AX DX, în care AX conține un cuvânt de ordin mai mic, este singura opțiune posibilă pentru plasarea cuvintelor lungi în registrele procesorului În tabel B arată toate modurile de adresare furnizate în În continuare, le vom revizui pe scurt Registrele sunt listate în rândurile de sus ale tabelului Ele pot fi folosite ca surse sau chiuvete în aproape toate comenzile Există registre pentru cuvinte și același număr pentru octeți Tabelul B Moduri de adresare a operanzilor (simbolul # înseamnă valoare numerică sau etichetă) Modul de adresare Exemple de operanzi Adresare registru Registrul octet Înregistrare octeți AH, AL, BH, BL, CH, CL, DH, DL După caz pentru cuvinte, pentru cuvintele AX, BX, CX, DX, SP, BP, SI, DI Adresare segment de date Adresare directă Adresă după cod operațional (#) Înregistrare adresare indirectă Adresă în registru (SI), (DI), (BX) Înregistrați adresarea cu un offset Adresarea registrului index Adresa se formează prin adăugarea BX cu SI/DI (BX)(SI), (BX)(DI) Adresarea indexului registrului offset Adresarea segmentului stivă BX plus SI DI plus offset #(BX)(SI), #(BX)(DI) Indicator de bază Adresă de adresare indirectă în registru (BP) Decalaj indicator de bază Adresa este formată din valoarea BP și offset-ul #(BP) Adresarea indicatorului de bază cu index Adresa se formează prin adăugarea BP și SI/DI (BP)(SI), (BP)(DI) Offset indice BP plus SI/DI plus offset #(BP)(SI), #(BP)(DI) indicatorul de bază Adresarea directă a datelor Prin informații directe, partea # octet/cuvânt Adresare implicită a instrucțiunilor Push/Pop Instruction Adresa indirectă (SP) PUSH, POP, PUSHF, POPF Încărcați sau stocați steaguri Înregistrați-vă cu steaguri de stare LAHF, STC, CLC, CMC Continuare Anexa B Programare în limbaj de asamblare Tabelul B (continuare) Modul de adresare Exemple de operanzi Difuzați XLAT AL, BX XLAT Comenzi șir repetate (SI), (DI), (CX) MOVS, CMPS, SCAS Comenzi de intrare și ieșire AX, AL IN #, OUT # Conversie octet, cuvânt AL, AX, DX CBW, CWD Rândurile de sub titlul Adresare segment de date listează modurile de adresare care sunt relevante pentru segmentele de date Adresele de acest tip sunt întotdeauna incluse într-o pereche de paranteze - vă permit să distingeți adresa din compoziția lor de o valoare de alt tip Cel mai simplu mod de adresare din această categorie este adresarea directă, în care adresa de date a operandului este inclusă în instrucțiune Exemplu: ADAUGĂ SH ( ) În acest caz, la registrul CX se adaugă conținutul cuvântului de memorie situat la adresele și În limbajul de asamblare, celulele sunt de obicei exprimate ca etichete, nu ca valori numerice, iar conversia este deja efectuată în timpul asamblarii Chiar și în instrucțiunile CALL și JMP, operandul țintă poate fi stocat în locația de memorie indicată de etichetă Parantezele din jurul etichetelor sunt absolut necesare (cel puțin pentru asamblatorul despre care vorbim), întrucât următoarea comandă are și dreptul de a exista: ADAUGĂ СХ, Totuși, această comandă exprimă o operațiune complet diferită și anume, adăugarea constantei la valoarea registrului CX, și nu conținutul cuvântului de memorie situat la adresa Simbolul # în Tabel B poate desemna o constantă numerică, o etichetă sau o expresie constantă etichetată Cu adresarea indirectă a registrului, adresa operandului este stocată într-unul dintre cele trei registre: BX, SI sau DI În toate aceste cazuri, ajunge în segmentul de date De asemenea, este posibil să plasați o constantă înaintea unui registru, caz în care adresa este setată prin adăugarea registrului la constantă Acest tip de adresare, numită adresare de registru deplasat, este utilă atunci când se lucrează cu matrice Deci, dacă registrul SI conține valoarea , atunci al cincilea caracter al șirului identificat de eticheta FORMAT poate fi încărcat în registrul AL folosind operatorul MOVB AL, FORMAKSI) În acest caz, întreaga linie este vizualizată în fiecare etapă printr-o creștere pozitivă sau negativă a valorii registrului Când folosiți operanzi-cuvinte, valoarea registrului se modifică de fiecare dată într-o direcție sau alta cu De asemenea, este posibil să plasați baza (adică adresa numerică de jos) a matricei în registrul BX, păstrând registrele SI sau DI pentru referință Această schemă se numește adresarea registrului index Exemplu: PUSH (BX)(DI) Memorie și adresare Acest cod preia conținutul unei celule dintr-un segment de date cu o adresă care este determinată de suma registrelor BX și DI Valoarea rezultată este apoi împinsă pe stivă Combinația ultimelor două tipuri de adresare are ca rezultat adresarea registrului indexat cu un offset: NU (IN)(DI) Această instrucțiune accesează cuvântul de memorie la adresele BX + DI + și BX + DI + Toate metodele de adresare indirectă aplicabile segmentului de date sunt relevante și pentru segmentul de stivă; în acest din urmă caz, registrul de bază BX este înlocuit cu indicatorul de bază BP Astfel, (VR) este doar un mod de adresare indirectă a stivei de registre, cu toate acestea, există moduri mai complexe, în special, adresare indirectă prin indicator de bază cu index și offset: ? (VR) (SI) Aceste moduri sunt utile atunci când accesați variabilele locale și parametrii funcției stocați la adresele stivei din subrutine Schema corespunzătoare este descrisă în subsecțiunea Apeluri subrutine Toate adresele corespunzătoare modurilor de adresare enumerate pot acționa atât ca surse, cât și ca destinații în operațiuni Luate împreună, aceste două categorii sunt numite adrese valide Modurile de adresare ale celor două categorii rămase nu presupun prezența receptorilor, deci adresele corespunzătoare nu se numără printre cele valabile Sunt folosite doar ca surse Modul de adresare în care operandul este un octet constant sau o valoare de cuvânt se numește adresare imediată De exemplu: SMR AX, Această instrucțiune compară valoarea din registrul AX cu constanta și setează biții din registrul flag în funcție de rezultat În cele din urmă, unele comenzi folosesc adresare implicită În astfel de instrucțiuni, operandul sau operanzii sunt doar implicite De exemplu: IMPINGE SEORUL Această instrucțiune împinge conținutul registrului AX în stivă; pentru a face acest lucru, scade valoarea lui SP cu unul și apoi copiază conținutul lui AX în celula către care SP indică acum În acest caz, registrul SP nu este menționat în comandă De asemenea, registrul steagului de stare nu este menționat în instrucțiunile de control al pavilionului Operanzii impliciti sunt folosiți și în alte instrucțiuni Procesorul oferă instrucțiuni speciale pentru mutarea (MOVS), compararea (CMPS) și răsfoirea șirurilor (SCAS) După executarea acestor comenzi șir, conținutul registrelor de index SI și DI este actualizat automat Acest mecanism se numește, în funcție de direcție, modul auto-incrementare sau auto-decrementare Direcția de creștere (pozitivă sau negativă) a registrelor SI și DI este determinată de indicatorul de direcție din registrul de indicatori de stare Un steag de direcție cu o valoare de zero indică o creștere pozitivă, iar un steag cu o valoare de unu determină o creștere negativă Valoarea de increment este de în instrucțiuni de octeți și în instrucțiuni de cuvinte Într-un fel, indicatorul de stivă este legat și de modurile de auto-increment și auto-decrement: valoarea sa este decrementată cu la începutul operațiunii PUSH și incrementată cu la sfârșitul operațiunii POP Anexa B Programare în limbaj de asamblare Setul de comenzi Orice computer se caracterizează, în primul rând, prin setul de comenzi pe care este capabil să le execute Pentru a înțelege cum funcționează un computer, este necesar să-i studiezi în detaliu setul de instrucțiuni În această secțiune, vom discuta cele mai importante comenzi Unele dintre aceste comenzi sunt prezentate în Tabelul B , unde sunt împărțiți în grupe Tabelul B Unele dintre cele mai importante instrucțiuni din procesorul Mnemonic Descriere Operanzi Indicatori de stare Despre SZ cu MOV(B) Mutare cuvânt, octet r e - - - - LEA Încărcați adresa validă r r, e # * * CMP(B) Compara operanzi e r, e # * * * * STD Setați steag de direcție (i) - - - - - CLD Indicatorul direcției de resetare (î) - - - - - STC Setare flag de transport - - - - CLC Clear Carry Flag - - - - Transfer CMC înapoi - - - - * LOOP Salt înapoi dacă DEC(CX) > Etichetă - - - - LOOPZ LOOPE Salt înapoi dacă Z = și DEC(CX) > Etichetă - - - - LOOPNZ LOOPNE Salt înapoi dacă Z = și DEC(CX) > Etichetă - - - - REP REPZ REPNZ Repetare șir de comandă șir de comandă - - - - MOVS(B) Mută șirul de cuvinte - - - - - LODS(B) Încarcă șirul de cuvinte - - - - - STOS(B) Stocare șir de cuvinte - - - - - SCAS(B) Vedeți șirul de cuvinte - * * * * Comparație șiruri de cuvinte CMPS(B) - * * * * Etichetă de ramură condiționată JCC - - - - JMP Salt la eticheta e, label - - - - CALL Salt la subrutina e, etichetă - - - - RET Întoarcere din subrutină -, # - - - - Excepție de sistem SYS Throw - - - - - Anexa B Programare în limbaj de asamblare Mutare, copiere și comenzi aritmetice Primul grup include comenzi de copiere și mutare Comanda MOV, care specifică în mod explicit adresele sursă și destinație, este extrem de importantă Dacă adresa sursă este un registru, adresa de destinație poate fi validă În tabel Operanzii de registru B sunt notați cu simbolul r, iar adresele reale cu simbolul e În consecință, combinația în cauză arată ca r Această desemnare este cea care este prima în celula de operand a instrucțiunii MOV Deoarece sintaxa instrucțiunii necesită ca adresa de destinație să fie primul operand și adresa sursă să fie a doua, caracterul săgeată la stânga ( ) este folosit pentru a indica operația de schimb în tabel Întrucât în acest caz există variante ale operației cu un octet și cu un cuvânt, câmpul operand al instrucțiunii XCHG conține denumirea r e Următorul tabel listează comanda de încărcare adrese valide (LEA) Determină valoarea numerică a adresei reale și o stochează într-un registru Urmează instrucțiunea PUSH, care își împinge operandul pe stivă Operandul său explicit poate fi fie o constantă (reprezentată prin caracterul "#" în coloana cu operand), fie o adresă reală (caracterul "e" în coloana cu operand) În plus, există un operand SP implicit care nu este specificat în sintaxa instrucțiunii Instrucțiunea scade valoarea SP cu și apoi stochează operandul la adresa către care SP indică după actualizare Următoarea comandă este POP Îndepărtează operandul din stivă și îl plasează la adresa reală Instrucțiunile PUSHF și POPF care împing și pop registrul de steag de stare au și operanzi impliciti Situația este similară cu instrucțiunea XLAT, care încarcă registrul de octeți AL din adresa formată prin adăugarea AL și BX Această comandă vă permite să efectuați căutări online în tabele de de octeți Setul de comenzi Comenzile IN și OUT definite în specificația oficială nu sunt implementate în interpret (și, prin urmare, nu sunt listate în Tabelul B ) De fapt, acestea sunt comenzi pentru mutarea datelor în și afară dintr-un dispozitiv I/O Adresa implicită din ele este întotdeauna registrul AX, iar al doilea operand al comenzilor este numărul de port al registrului dispozitivului țintă În a doua grupă a Tabelului B introduce comenzi de adunare și scădere Toate sunt caracterizate de aceeași combinație de trei operanzi ca și pentru MOV: de la adresa reală la registru (r ) în acest caz indică operații de comparare și verificare cu doi operanzi imuați La executarea instrucțiunii TEST cu operanzi, se efectuează o operație logică AND, în urma căreia steagurile zero și semn sunt setate sau resetate Valoarea calculată nu este salvată, iar operanzii rămân neschimbați Comanda CMP se reduce la calcularea diferenței dintre operanzi, ca urmare, toate cele patru steaguri sunt setate sau șterse Indicatorul de direcție, care reglează incrementul negativ și pozitiv al valorilor registrelor SI și DI la executarea instrucțiunilor șir, poate fi setat sau resetat de instrucțiunile STD și, respectiv, CLD Procesorul oferă, de asemenea, flag-uri de paritate și de transport Indicatorul de paritate, după cum sugerează numele său, indică dacă rezultatul este par sau impar Indicatorul de transport al serviciului verifică dacă a avut loc o transportare în partea inferioară (de biți) a adresei țintă În plus, există instrucțiuni LAHF și SAHF care copiază octetul inferior al steagului Setul de comenzi înregistrează-te pentru a înregistra AH și invers Flag-ul de overflow este situat în octetul înalt al registrului de cod de condiție și nu este copiat în timpul execuției comenzilor de mai sus Comenzile și steagurile discutate în acest paragraf sunt introduse în primul rând pentru compatibilitatea cu procesoarele și Operații de buclă și operații cu șiruri repetate Următorul grup conține comenzi în buclă Instrucțiunea LOOP incrementează registrul CX și, dacă este pozitivă, sare înapoi la eticheta specificată Instrucțiunile LOOPZ, LOOPE, LOOPNZ și LOOPNE, printre altele, verifică valoarea steagului zero pentru a vedea dacă bucla ar trebui să se termine înainte ca registrul CX să ajungă la zero Adresa țintă în toate comenzile din categoria LOOP nu trebuie să fie mai mare de de octeți de la poziția curentă a contorului de programe; acest lucru se datorează faptului că comenzile au un offset semnat pe biți Numărul de instrucțiuni (spre deosebire de octeți) prin care se poate face un salt nu este determinat cu precizie din cauza diferenței de lungime dintre aceste instrucțiuni De regulă, primul octet specifică tipul de instrucțiune și, în multe cazuri, conținutul segmentului de cod de instrucțiune este limitat la acesta Al doilea octet determină adesea registrele utilizate de instrucțiune și modul de adresare a registrului, iar dacă instrucțiunea folosește un offset sau conține date imediate, lungimea sa crește la patru până la șase octeți Lungimea medie a instrucțiunii este de , octeți, astfel încât cantitatea de salt înapoi în cicluri este limitată la aproximativ de instrucțiuni Există o serie de mecanisme speciale pentru organizarea ciclurilor de instrucțiuni șiruri: REP, REPZ și REPNZ Cele cinci comenzi șir listate în următorul grup de tabel B , utilizați adrese implicite și moduri de operare auto-increment/auto-decrementare cu registre index În toate aceste instrucțiuni, registrul SI indică segmentul de date, iar registrul DI indică un segment suplimentar bazat pe conținutul registrului ES La fel ca REP, comanda MOVSB vă permite să mutați linii întregi simultan Lungimea șirului este determinată de valoarea registrului CX Deoarece comanda MOVSB nu afectează starea steagurilor, nu este posibil să se verifice prezența unui octet ASCII-zero în timpul copierii folosind REPNZ; Pentru a corecta această situație, trebuie mai întâi să emiteți instrucțiunea REPNZ SCASB, care vă permite să plasați o valoare semnificativă în registrul CX, apoi să executați REP MOVSB Un exemplu de utilizare a acestui mecanism în practică este oferit în lista de coduri de copiere a șirurilor din secțiunea Exemple Când lucrați cu toate comenzile menționate, trebuie acordată o atenție deosebită registrului segmentului ES (dacă valoarea acestuia nu se potrivește cu valoarea registrului DS) Deoarece interpretul implementează un model de memorie mică, ES = DS = SS Sariți și apelați comenzi În ultimul grup de Tabel LA sunt prezentate comenzi de sărituri condiționate și necondiționate, apel de subrutine și întoarcere Cea mai simplă dintre acestea este instrucțiunea JMP Anexa B Programare în limbaj de asamblare Eticheta din ea poate indica adresa țintă sau conținutul oricărei adrese valide Trebuie luată în considerare diferența dintre tranzițiile apropiate și cele îndepărtate Obiectul tranziției apropiate este segmentul de cod curent, neschimbat în timpul execuției operației În procesul unei tranziții îndepărtate, valoarea registrului CS, dimpotrivă, se modifică În cazul adresei directe folosind o etichetă, noua valoare a registrului de segment de cod este setată la un apel după etichetă; în cazul unei adrese valide, un cuvânt lung este selectat din memorie, rezultând cuvântul scăzut corespunzător etichetei țintă și cuvântul înalt corespunzător noii valori a registrului de segment de cod Nu este nimic surprinzător într-o asemenea diferență Pentru a sări la o adresă arbitrară într-un spațiu de adrese de de biți, este necesar un mecanism care să determine o adresă mai lungă de biți Acest mecanism există și constă în atribuirea de noi valori registrelor CS și PC Salturi condiționate Procesorul are tipuri de salturi condiționate, dintre care unele au mai multe nume (de exemplu, JUMP GREATER OR EQUAL și JUMP NOT LESS THAN sunt echivalente) Toate sunt enumerate în tabel V Z Distanța maximă de salt este de de octeți de la instrucțiunea curentă Dacă obiectul de săritură este în afara razei de acțiune, trebuie să implementați un salt compus (săritură sau săritură) În acest caz, a doua tranziție cu condiția opusă este folosită pentru a trece prin următoarea comandă Dacă instrucțiunea următoare definește un salt necondiționat la adresa țintă, atunci combinația acestor două instrucțiuni nu face decât să prelungească saltul de tipul specificat De exemplu: JB Farlabel Această comandă trebuie înlocuită cu următoarea construcție: JNAlf JMP FARLABEL : Cu alte cuvinte, dacă instrucțiunea JUMP BELOW nu poate fi executată, se realizează o construcție constând din instrucțiunea JUMP NOT ABOVE cu eticheta din apropiere ca obiect și un salt necondiționat la FARLABEL Rezultatele sunt aceleași în ambele cazuri, diferența constă doar în costuri mai mari sau mai mici de timp și spațiu Dacă obiectul de tranziție este prea departe, asamblatorul aranjează automat o tranziție compusă Este destul de dificil să efectuați corect astfel de calcule Să presupunem că distanța până la obiect este aproape de maximul admis și, în același timp, unele comenzi intermediare conțin sărituri condiționate O tranziție externă poate fi efectuată numai după determinarea distanțelor tranzițiilor interne Într-o astfel de situație, asamblatorul ia anumite măsuri de precauție De exemplu, poate forma o tranziție compozită fără o nevoie strictă de ea Un salt condiționat imediat este generat de asamblator numai dacă obiectul de salt este exact la îndemână Setul de comenzi Tabelul B- - Salturi condiționate Comanda Descriere Condiție de salt JNA, JBE Mai mic sau egal cu CF = sau ZF = JNB, JAE, JNC Cel puțin CF = JE, JZ Zero, este egal cu ZF = t@tabl body = JNLE, JG Mai mare decât SF = OF și ZF = JGE, JNL Mai mare sau egal cu SF = OF JO Overflow OF = JS Semn negativ SF = Valoarea JCXZ CX este zero CX = JB, JNAE, JC Sub CF = JNBE, JA Deasupra CF = și ZF = JNE, JNZ Nu este egal cu zero, nu este egal cu ZF = JL, JNGE Mai puțin de SF * OF JLE, JNG Mai mic sau egal cu SF F OF sau ZF = JNO Fără depășire OF = JNS SF nenegativ = Cele mai multe salturi condiționate depind de semnalizatoarele de stare și sunt precedate de instrucțiuni de comparare sau de testare Instrucțiunea CMP scade operandul sursă din operandul destinație, setează codurile de stare și apoi resetează rezultatul Niciunul dintre operanzi nu este modificat Dacă rezultatul este zero sau bitul de semn este setat (indicând un rezultat negativ), bitul de flag corespunzător este setat Dacă rezultatul nu poate fi exprimat într-un număr valid de biți, este setat indicatorul de depășire Dacă bitul cel mai semnificativ este urmat de o transportare, indicatorul de transport este setat Cu salturi condiționate, toți acești biți pot fi verificați Instrucțiunile GREATER THAN și LESS THAN sunt folosite pentru a procesa operanzi semnati Operanzii nesemnați sunt procesați de instrucțiunile de SUS și DE JAS Apeluri subrutine Procesorul are o instrucțiune care vă permite să apelați proceduri, care în limbajul de asamblare sunt de obicei numite subrutine Prin analogie cu comenzile de tranziție, aici există comenzi aproape și departe Interpretul implementează doar apelul apropiat Obiectul de apel este fie o etichetă, fie se află la o adresă validă Parametrii necesari pentru apelarea subrutinelor sunt plasați inițial pe stivă în ordine inversă (Figura B ) În limbajul de asamblare, parametrii sunt de obicei numiți argumente, deși nu există nicio diferență fundamentală între acești termeni După plasarea argumentelor pe stivă, instrucțiunea CALL este executată În primul rând, împinge valoarea curentă a contorului programului în stivă Anexa B Programare în limbaj de asamblare păstrând astfel adresa de retur Adresa de retur este adresa la care execuția programului apelant se reia după revenirea subrutinei VR + VR + VR + VR + VR VR- VR- VR- BP- Argumentul Argumentul Adresa expeditorului Valoare veche BP (creștere) sau ) Adresele de retur subprogramelor sunt indicate printr-o cifră înaintea valorii hexazecimale Secțiunea din dreapta sus afișează partea din fișierul sursă care conține următoarea comandă în ordinea execuției Poziția contorului de programe, ca și poziția indicatorului stivei, este determinată de săgeata (=>) Sub secțiunea procesor sunt ultimele puncte de apel ale subrutinei din codul sursă Mai jos se află secțiunea de comandă de urmărire, cu comanda anterioară în partea de sus și cursorul de comandă în partea de jos Rețineți că fiecare comandă trebuie să se încheie cu un întoarcere de cărucior (pe tastaturile PC, aceasta se introduce prin apăsarea tastei Enter) Secțiunea inferioară poate conține șase elemente ale memoriei globale de date Fiecare astfel de element începe la o poziție relativă la o anumită etichetă, urmată de o poziție absolută în segmentul de date Apoi, se pun două puncte și octeți sunt afișați în reprezentare hexazecimală Următoarele poziții sunt rezervate caracterelor care pot fi urmate de patru cuvinte în notație zecimală Octeții, caracterele și cuvintele reprezintă aceeași zonă de memorie, dar pentru o expresie de caracter Anexa B Programare în limbaj de asamblare sunt furnizați trei octeți suplimentari Această decizie se datorează faptului că inițial nu este clar sub ce formă vor fi prezentate datele: sub formă de numere întregi semnate sau nesemnate, sau sub formă de șir Secțiunea din dreapta din mijloc este rezervată pentru intrare și ieșire Prima linie este ieșirea erorii de urmărire, a doua linie este intrarea, iar următoarele câteva linii sunt ieșirea Ieșirea de eroare este precedată de litera £, intrarea de litera I și ieșirea standard de simbolul > Într-un câmp de introducere, o săgeată (->) indică următorul indicator în ordinea citirii Când apelați read sau getchar, următoarea expresie introdusă pe linia de comandă a tracerului intră în câmpul de intrare În acest caz, trebuie să completați intrarea apăsând tasta Enter Partea momentan neprocesată a șirului este după săgeată (->) De obicei, un urmăritor citește comenzile și intrările dintr-un fișier de intrare standard În același timp, puteți pregăti un fișier cu comenzi de urmărire și un fișier cu linii de intrare care va fi citit înainte de a trece controlul fișierului de intrare standard Fișierele de comandă Tracer sunt salvate cu extensia t, în timp ce fișierele de intrare sunt salvate cu extensia i În limbajul de asamblare, cuvintele cheie, rutinele de sistem și pseudo-instrucțiunile pot folosi atât caractere majuscule, cât și litere mici Procesul de asamblare creează un fișier $ în care cuvintele cheie cu litere mici sunt convertite în majuscule și returnările de transport sunt eliminate Cu acest sistem, fiecare proiect (să zicem că se numește pr) poate avea până la șase fișiere: Fișier cu cod sursă în limbaj de asamblare (pr s) Fișier cu codul sursă îmbinat (rg $) Descărcați fișierul (rg ) Fișier de intrare standard presetat (pr i) Fișier preinstalat cu comenzi de urmărire (pr t) Fișier pentru conectarea codului în limbaj de asamblare cu fișierul de descărcare (pr #) Tracerul umple secțiunea din dreapta sus a ferestrei și câmpul contorului programului cu conținutul ultimului fișier În plus, urmăritorul verifică când a fost creat fișierul de descărcare: înainte de ultima modificare a codului sursă al programului sau după; în primul caz, se generează un avertisment Tracer Commands Comenzile de urmărire sunt listate în tabel LA Cele mai importante dintre acestea sunt instrucțiunea de returnare unică (primul rând al tabelului), care execută o instrucțiune de procesor și instrucțiunea de ieșire q (rândul de jos al tabelului) Numărul ca nume de instrucțiune indică numărul de instrucțiuni de procesor pregătite pentru execuție Astfel, numărul k este echivalent cu repetarea ^-fold a comenzii return Un efect similar este obținut dacă numărul este urmat de un semn de exclamare (!) sau de un X Fiecare comandă trebuie să fie urmată de un întoarcere de cărucior (prin apăsarea tastei Enter) O celulă goală indică faptul că nu este necesară nicio acțiune suplimentară în afară de întoarcerea căruciorului Comenzile fără valoare în coloana Adresă nu au o adresă Caracterul # denotă un decalaj întreg trasor Tabelul B Tracer Commands Adresă Comanda Exemplu Descriere Executarea comenzii unice #,! ,х Executarea de # comenzi /T+# g J , /start + g Rulați la linia # după T /T +# b /start + b Plasează punctul de întrerupere pe linia # după eticheta T /t +# s /start + c Eliminați punctul de întrerupere din linia # după T # g g Execuția programului până la rândul # gg Rulați programul până când se ajunge din nou la linia curentă bb Plasați un punct de întrerupere pe linia curentă c c Eliminați punctul de întrerupere din linia curentă nn Executați programul până la următoarea linie r Executați la punctul de control sau la final = = Programul rulează la același nivel de subrutină - - Rulați la nivelul subrutinei minus ++ Rulați la nivelul subrutinei plus /D +# /buf + Afișează segmentul de date la etichetă +# /D +# d , ! /buf + d Afișează segmentul de date la etichetă +# R , CTRL LR Actualizați ferestrele qq Terminați trasarea, reveniți la shell Comanda g vă permite să săriți la o anumită linie dintr-un fișier sursă Această comandă vine în trei versiuni Dacă este precedat de un număr de linie, trasorul continuă până când ajunge la acea linie Dacă există un steag /T (cu sau fără +# caractere în adresă), numărul liniei pe care trebuie să se oprească trasorul este calculat din eticheta comenzii T Dacă nu există elemente suplimentare înaintea comenzii g, trasorul continuă pentru a executa comenzi până când ajunge din nou la linia cu numărul curent Există două variante ale comenzii /labei: pentru etichetele de comandă și etichetele de date În primul caz, rândul din fereastra de jos este completat sau înlocuit cu setul de date începând cu eticheta dată În al doilea caz, comanda /labei: este echivalentă cu comanda e După etichetă, un semn plus și un număr (în tabelul B , numerele sunt notate cu simbolul #) pot fi setate pentru a permite decalajul față de eticheta Comanda b poate fi folosită pentru a seta un punct de întrerupere Comanda b poate fi precedată de o etichetă de comandă cu sau fără decalaj Dacă se întâlnește o linie de punct de întrerupere în timpul execuției, trasorul se oprește Pentru a relua execuția de la un punct de control, este necesară o comandă de returnare sau de rulare Dacă eticheta și numărul sunt omise, punctul de întrerupere este setat pe linia curentă Comanda specială c vă permite să eliminați punctul de întrerupere, care, ca și comanda b, poate fi precedat de etichete și numere Există Anexa B Programare în limbaj de asamblare de asemenea, comanda de rulare r, pe care trasorul o execută până la un punct de control, apel la comanda de sfârșit sau sfârșitul comenzilor În plus, urmăritorul ține evidența nivelului subrutinei la care rulează programul Acest nivel este listat în secțiunea procesor; poate fi determinată și de numerele din secțiunea stivă Există trei comenzi bazate pe nivelurile subrutinei Comandă - face ca programul de urmărire să ruleze până când nivelul curent al subrutinelor este înlocuit cu unul inferior (mai precis, următorul în ordine descrescătoare) De fapt, această instrucțiune continuă să execute instrucțiunile procesorului până la sfârșitul subrutinei curente Funcția opusă este efectuată de comanda +, care face ca programul de urmărire să ruleze până când sare la un nivel superior (următorul în ordine crescătoare) de subrutine Comanda = continuă trasarea la un nivel similar cu cel curent și poate fi folosită pentru a executa subrutine în cadrul comenzii CALL Când utilizați comanda =, detaliile subrutinei nu sunt afișate în fereastra de urmărire Există o comandă similară, n, care continuă execuția până la următoarea linie a programului Este util în special atunci când este apelat ca o comandă LOOP; execuția se oprește în același timp cu sfârșitul buclei Acțiuni pregătitoare Această secțiune listează pașii de care trebuie să vă pregătiți pentru a utiliza instrumentele de mai sus În primul rând, trebuie să alegeți software-ul pentru o anumită platformă Am compilat versiuni pentru Solaris, UNIX, Linux și Windows Toate aceste versiuni sunt disponibile pe CD-ul însoțitor și pe internet la www prenhalLcom/tanenbaum Accesați site-ul, apoi secțiunea Companion Web Site aferentă acestei cărți și, în final, selectați linkul dorit din meniul din stânga Despachetați fișierul zip selectat în folderul de asamblare Acest folder și subfolderele sale conțin tot materialul necesar Pe CD, folderele principale sunt Bigendnx, LtlendNx și MSWindos Fiecare dintre ele are un subfolder de asamblare, în care, din nou, puteți găsi tot ce aveți nevoie Cele trei foldere menționate sunt pentru sistemele Little Endian UNIX (adică stațiile de lucru Sun), pentru sistemele Little Endian UNIX (sisteme de operare Linux instalate pe PC) și sistemele Windows După despachetare sau copiere, următoarele subfoldere ar trebui să apară în folderul de asamblare: READ ME, bin, as src, trce src, exemple și exercițiu Fișierele sursă precompilate sunt în folderul bin, iar binarele corespunzătoare se află în folderul exemple Pentru a obține informații de bază despre cum funcționează sistemul, accesați folderul exemple și introduceți comanda t HlloWrld Această comandă este prezentată în primul exemplu din secțiunea Exemple Codul sursă pentru asamblator se află în folderul as src Fișierele sursă sunt scrise în C și pot fi recompilate cu următoarea comandă Pentru Exemple Pentru platformele compatibile cu POSIX, utilitarul MakefiLe este furnizat în folderul sursă pentru a efectua recompilarea Pentru Windows, există un fișier batch make bat Este posibil să fie nevoie fie să mutați executabilele în folderul programului după compilare, fie să modificați variabila PATH pentru a face ca asamblatorul as și programul de urmărire t să fie vizibile din folderele sursă Dacă acest lucru nu se face, atunci în loc de comanda t , va trebui să introduceți calea completă către fișier Pe sistemele Windows și XP, driverul terminalului ansi sys trebuie instalat; Pentru a face acest lucru, adăugați următoarea linie în fișierul de configurare config nt: dev ce=^siystemRoot^\Siystem \ansi sys Acest fișier se află pe următoarea cale: ♦ în Windows - \winnt\system \config nt; ♦ în Windows XP - \windows\system \config nt Pe Windows , și ME, șirul de instalare a driverului trebuie introdus în fișierul config sys Pe UNIX și Linux, este de obicei instalat implicit Exemple În secțiunile Procesor , Memorie și Adresare și Set de instrucțiuni , ne-am uitat la procesorul , memoria și instrucțiunile acestuia Apoi, în secțiunea "Asamblator", am analizat limbajul principal de asamblare pentru acest manual - as Secțiunea Tracer a fost dedicată studiului trasorului În cele din urmă, în secțiunea Etape pregătitoare, au fost furnizate instrucțiuni pentru configurarea casetei de instrumente Teoretic, toate aceste informații sunt destul de suficiente pentru scrierea și depanarea programelor în limbaj de asamblare folosind aceste instrumente În același timp, ni se pare că va fi interesant pentru cititor să se familiarizeze cu exemple detaliate de programe în limbaj de asamblare și modalități de a le depana folosind un trasor Astfel de exemple sunt prezentate în această secțiune Toate programele pe care le vom acoperi aici pot fi găsite în folderul de exemple al setului de instrumente Auto-asamblarea și urmărirea fiecărui exemplu sunt binevenite cu căldură Salut Lume Să începem cu exemplul de program HLLoWrLd s Listarea B arată codul sursă al programului, iar în fig B arată conținutul ferestrei de urmărire În listă, un caracter de comentariu (!) separă comenzile de numerele de rând Primele trei linii conțin definiții constante care leagă aliasurile celor două apeluri de sistem și fișierul de ieșire la reprezentările lor interne respective Pseudocomandă SECT pe linia indică faptul că următoarele rânduri fac parte din secțiunea de text, cu alte cuvinte, sunt instrucțiuni ale procesorului De asemenea, tot ceea ce urmează linia este considerat date Linia inițializează un șir de date format din octeți, inclusiv un spațiu și un caracter newline (\n) la sfârșit Anexa B Programare în limbaj de asamblare EXIT = I CS DS=SS=ES: MOV CX,de-hw ! WRITE= I AH- AL: c AX: PUSH CX I STDOUT = I BH: BL:OO BX: PUSH HW I SECT TEXT ! CH: CL:Oc CX: PUSH STDOUT ! start: I DH: DL:OO DX: PUSH WRITE ! MOV CX,de-hw I SP fd SF DSZC => SYS ! unsprezece PUSH CX I BP CC - > P - - => ADD SP, ! PUSH hw I SI : IP: : c:PC SUB CX AX ! PUSH STDOUT! Dl: start + c PUSH CX ! PUSH WRITE E SYS I ADD SP, I SUB CX AX hw PUSH CX ■ > Bună lume\n PUSH EXIT I hw + = : c c f f Hello World SYS SECT DATE hw: ASCII "Hello World\n" I de: BYTE I Orez LA Conținutul ferestrei de urmărire când este executat programul din lista B Lista B Codul de asamblare al programului HlloWrld s EXIT = ! SCRIE= ! STDOUT = ! SECT TEXT ! start: ! MOV CX, de-hw ! PUSH CX! PUSH hw! PUSH STDOUT! PUSH SCRIE! SYS! unsprezece ADAUGĂ SP, ! SUB CX AX ! PUSH CX! PUSH EXIT ! SYS! SECT DATE ! hw:! ASCII "Bună lume\n" ! de: BYTE ! Rândurile , și conțin etichete, notate cu două puncte (:) Ele reprezintă valori numerice, asemănătoare constantelor În acest caz, asamblatorul trebuie să determine aceste valori numerice Deoarece eticheta de început se află la începutul secțiunii de text, se presupune că valoarea corespunzătoare este , dar valorile din etichetele ulterioare ale secțiunii de text (nu sunt afișate în acest exemplu) sunt determinate de numărul de octeți de cod precedați Acum luați în considerare linia Se termină cu diferența dintre cele două etichete - o constantă numerică Astfel, linia poate fi echivalată cu următoarea expresie: MOV CX, Exemple Singura diferență dintre ele este că într-un caz lungimea șirului este determinată de asamblator, iar în celălalt de programator Valoarea specificată aici exprimă cantitatea de spațiu din secțiunea de date rezervată pentru a găzdui linia situată pe linia Instrucțiunea MOV de pe linia este o comandă de copiere de -hw în registrul CX Conținutul liniilor - demonstrează mecanismul de generare a apelurilor de sistem în setul de instrumente utilizat De fapt, aceste linii reprezintă un apel de funcție tradus în limbaj de asamblare din limbajul C: write(l, hw, ); Aici, primul parametru este un descriptor de fișier la ieșirea standard ( ), al doilea este adresa liniei de afișat (hw), iar al treilea este lungimea liniei ( ) În liniile - , acești parametri sunt împinși pe stivă în ordine inversă, ceea ce corespunde secvenței de apel acceptate în C și utilizate de acest program de urmărire Linia împinge numărul de apel de sistem pentru funcția write( ) în stivă, iar linia AND execută apelul în sine Această ordine este în mare măsură în concordanță cu execuția unui program în limbaj de asamblare în clone UNIX (sau Linux), dar atunci când rulează pe un alt sistem de operare, trebuie ajustată pe baza regulilor specifice pentru executarea apelurilor de sistem Cu toate acestea, chiar și atunci când rulează pe Windows, asamblatorul as și trasorul t implementează reguli de apelare UNIX Apelul de sistem pe linia AND este responsabil pentru ieșirea datelor Codul de pe linia curăță stiva, resetând indicatorul stivei la valoarea pe care o avea înainte ca patru cuvinte de octeți să fie plasate pe stivă Dacă apelul de scriere reușește, numărul de octeți scriși este returnat în registrul AX Pe linia , rezultatul apelului de sistem după linia AND este scăzut din lungimea inițială a liniei în CX; aceasta verifică succesul apelului, adică scrierea efectivă a tuturor octeților Astfel, codul de ieșire trebuie să fie egal cu zero dacă apelul are succes și, în consecință, nu este egal cu zero în caz contrar Liniile și pregătesc apelul de sistem de ieșire pe linia ; pentru a face acest lucru, codurile de ieșire și funcțiile legate de apelul EXIT sunt introduse în stivă Rețineți că în comenzile MOV și SUB, primul argument indică destinația și al doilea argument spre sursă Aceasta este particularitatea asamblatorului nostru; la alți asamblatori, ordinea poate fi diferită Alegerea de către dezvoltatori a uneia sau alteia opțiuni, în general, este arbitrară Acum să încercăm să asamblam și să rulăm programul HHoWdd s Comenzile prezentate sunt potrivite atât pentru UNIX, cât și pentru Windows Pentru Linux, Solaris, MacOS X și alte clone UNIX, procedura este aceeași ca și pentru UNIX de bază Mai întâi, deschideți o fereastră de prompt de comandă (shell shell) În Windows, în cele mai multe cazuri, acest lucru se face selectând Start ► Toate programele ► Accesorii ► Prompt de comandă (Start ► Programe ► Accesorii ► Prompt de comandă) Apoi, treceți la directorul de exemple cu comanda cd Argumentul acestei comenzi este ales în funcție de locația casetei de instrumente în sistemul de fișiere Apoi verificați dacă există binare de asamblare și urmărire în acest director; pentru a face acest lucru, utilizați comanda Îs (UNIX) sau dir (Windows) Aceste fișiere sunt numite Anexa B Programare în limbaj de asamblare as și, respectiv, t Într-un mediu Windows, au extensia exe, dar nu trebuie să o specificați în comenzi Dacă nu există fișiere de asamblare și urmărire în directorul numit, găsiți-le și copiați-le în el După aceea, asamblați programul de testare folosind comanda as HlloWrld s Dacă binarul de asamblare se află într-adevăr în directorul de exemple, dar încă primiți o eroare după rularea acestei comenzi, pe UNIX încercați linia: /as HlloWrld s Pe Windows, în același scop, utilizați linia: \as HlloWrld s Dacă ansamblul se încheie cu succes, ar trebui să fie afișate următoarele mesaje: Project HlloWrld listfile HIloWrld $ Project HlloWrld num file HlloWrld # Project HlloWrld loadfile HlloWrld Desigur, trebuie create și fișierele corespunzătoare Dacă nu au existat mesaje de eroare, introduceți comanda t HlloWrld Ca rezultat, o săgeată va apărea în secțiunea din dreapta sus a ferestrei de urmărire, indicând comanda MOV CX de-hw Aceasta este comanda de la linia din listarea B Apoi apăsați tasta de întoarcere la cărucior (numită Enter pe tastaturile PC) După cum puteți vedea, acum săgeata indică către comandă PUSH CX În registrul CX, conform conținutului secțiunii din stânga a ferestrei, valoarea este acum Apăsați din nou tasta de întoarcere a căruciorului și rețineți că valoarea s a apărut în secțiunea din mijloc sus - echivalentul hexazecimal al zecimalului Această secțiune arată conținutul stivei, unde în acest moment există un cuvânt - Apăsați tasta de întoarcere caruș de încă trei ori și vedeți cum vor fi procesate comenzile din liniile , și După aceea, ar trebui să fie procesate fi patru elemente pe stivă, iar în secțiunea din stânga, valoarea contorului programului este indicată cu numărul hexazecimal b Data viitoare când apăsați tasta de întoarcere cărucior, va fi executat un apel de sistem și următoarea linie va apărea în secțiunea din dreapta jos a ferestrei: "Bună lume\n" După cum puteți vedea, acum valoarea registrului SP este x ff O altă apăsare a tastei va crește SP cu - până la x ff După patru apăsări ale tastei de întoarcere a căruciorului, apelul de sistem de ieșire se va finaliza, la fel ca și traseul în sine Exemple Pentru a înțelege cum funcționează totul, este util să deschideți fișierul hLLoWrLd s în orice editor de text (este mai bine să refuzați utilizarea procesoarelor de text în acest caz) Pe UNIX, acest lucru se poate face în ex, vi sau emacs; pe Windows, alegerea cade în mod firesc pe Notepad (Notepad), pentru a deschide, de obicei, selectați comanda Start ► Toate programele ► Accesorii ► Notepad (Start ► Programe ► Accesorii ► Notepad) Procesorul de text Word nu este potrivit, deoarece poate distorsiona textul programului atât atunci când este afișat pe ecran, cât și când este salvat Schimbați mesajul de pe linia , salvați fișierul, asamblați-l și rulați-l în tracer Așa că vei face primul pas în domeniul programării în limbaj de asamblare Registre de uz general Următorul exemplu arată în detaliu mecanismul de mapare a registrului, precum și unul dintre "capcanele" operației de multiplicare B arată secțiunea de înregistrare a ferestrei trasoare după executarea liniei Lista B O parte a programului genReg s start: ! MOV AX, ! ADDB AH,AL ! MOV CX,(ori) ! MOV BX,mul dat! MOV AX (BX) ! buză: MUL (BX) ! LOOP buza! SECT DATE ! unsprezece ori: CUVINTUL ! mul dat: WORD ! CS: DS=SS=ES AH: AL: AX: BH: BL: BX: CH: CL: a CX: DH: DL:OO DX: SP: fe SF ODSZC BP: CC->P- S : IP : : PC Dl: art + - A CS: AN: AL: HH: BL: CH: CL: DH: DL; SP: BP: SI: Dl: fe DS=SS=ES ZC-c AX: BX: CX: DX: O DS SF CC IP: :pornire PC + b Orez LA Secțiunea registru fereastră trasoare: după executarea liniei (a); după șapte treceri ale buclei de multiplicare (b) Următoarea instrucțiune de pe linia încarcă valoarea în registrul AX: MOV AX, Anexa B Programare în limbaj de asamblare Ca rezultat, registrul AH este setat la , iar registrul AL este setat la Apoi, pe linia , se adaugă valorile AL și AH, iar valoarea lui AH este trei Linia copiază conținutul variabilei timpi ( ) în CX Linia încarcă registrul BX cu adresa variabilei mul dat egală cu , deoarece se află în al doilea octet al secțiunii de date În acest moment, captura de ecran prezentată în Fig B , a Rețineți că AH este , AL este și AX este ; acest lucru nu este surprinzător, deoarece x + = Următoarea comandă (pe linia ) copiază conținutul variabilei mul dat în registrul AX Astfel, după apăsarea tastei retur caruș, valoarea lui AX se va schimba la Acum suntem gata să rulăm o buclă care înmulțește conținutul registrului AX cu cuvântul BX (adică mul dat + ), care conține valoarea Adresa țintă implicită pentru instrucțiunea MUL este combinația de registru DX : AX La prima iterație a buclei, rezultatul ( ) se potrivește într-un cuvânt, deci este stocat în AX și DX rămâne zero Conținutul tuturor registrelor după treceri ale ciclului de înmulțire este prezentat în fig B , b Întrucât valoarea inițială a lui AX a fost , după șapte înmulțiri cu , rezultatul este Deoarece nu se încadrează în registrul AX, produsul este stocat în registrul de de biți format prin concatenarea registrelor DX : AX; astfel, DX conține valoarea și AX conține Când este calculat, se dovedește într-adevăr că x + + = Rețineți că valoarea CX în această etapă este , deoarece instrucțiunea LOOP o reduce cu una în timpul fiecare trecere Deoarece valoarea inițială a acestui registru era , după șapte apeluri la instrucțiunea MUL (și șase treceri ale instrucțiunii LOOP), valoarea CX a scăzut la Dificultăți apar în timpul următoarei operațiuni de înmulțire La înmulțire, este implicată doar valoarea AX, în timp ce valoarea DX este ignorată; astfel, instrucțiunea MUL înmulțește AX ( ) cu și obține Adică, noua valoare a lui AX devine , iar registrul DX este setat la zero, ceea ce este incorect numeric Apelarea instrucțiunilor și a registrelor pointerului Următorul nostru exemplu, vecprod s, este un program mic care calculează produsul interior a doi vectori, veci și vec Codul său este prezentat în Lista B Listarea V Z Programul vecprod s -EXIT= -PRINTF= SECT TEXT Inpstart: MOV BP SP împinge vec PUSH veci MOV CX,vec -vecl SHR CX l PUSH CX ! EXIT definiția valorii ! Definiția valorii PRINTF ! începutul secțiunii de text ! definiție de etichetă inpstart ! Salvați SP în BP ! introducere la adresa stivei ѵec ! împingând adresa veci pe stivă ! CX = numărul de octeți din vector ! CX = numărul de cuvinte din vector ! introducere stiva de cuvinte Exemple CALL vecmul MOV ( nprod),AX PUSH AX ! apel la vecmul ! mutați AX ! introducere în stiva ! rezultatul ieșirii PUSH pfmt! introducere în stiva ! formatează adresele șirurilor PUSH PRINTF ! introducere în stiva ! codul funcției PRINTF SYS ADD SP PUSH PUSH EXIT SYS vecmul: ! PRINTF apel ! stivă clară! introducere în stiva de coduri de stare! introducere în stiva de coduri a funcției EXIT ! apel de funcție EXIT ! start vecmul(count, veci, vec ) PUSH BP MOV BP SP ! împingând valoarea BP pe stivă ! copiați SP în BP ! pentru a accesa argumente MOV CX CBP) ! de plasare contor în SH ! pentru controlul ciclului MOV SI, (BP) MOV DI, (BP) PUSH : LODS MUL (DI) ADD - (BP),AX ! SI = veci! DI = vec ! împingând valoarea pe stivă! mutați (SI) la AX ! înmulțiți AX cu (DI) ! plus AH! la valoarea stocată ADAUGĂ DI, ! trepte DI pentru a indica ! la următorul element LOOP b POP AX POP BP RET ! dacă CX > , reveniți la eticheta b ! Popping partea de sus a stivei în AX ! de recuperare BP ! întoarcere din subrutină SECT DATA pfmt: ASCIZ "Produs interior îs: ftd\n" ALIGN veci: WORD , , , , vec : WORD , , , , SECT BSS inprod: SPACE ! începutul secțiunii de date ! de linii! paritate forțată de adrese! vector ! vector ! începutul secțiunii BSS! spatiu alocat pentru nprod Prima parte a acestui program este de a pregăti un apel către funcția vecmul; pentru a face acest lucru, SP este stocat în BP, iar apoi adresele vec și veci sunt împinse pe stivă, ceea ce face posibil ca funcția vecmul să le acceseze Apoi, în linia , lungimea vectorului în octeți este încărcată în CX După mutarea acestui rezultat cu bit la dreapta (pe linia ), valoarea CX exprimă numărul de cuvinte din vector care este împins pe stiva pe linia Apelul către vecmul se face pe linia AND Merită remarcat, din nou, că argumentele subrutinei sunt împinse în stivă în ordine inversă, iar acest lucru se face pentru a se conforma ordinii de apelare C Deci, folosind C, funcția vecmul poate fi numită după cum urmează: vecmul(count, veci, vec ) În timpul execuției instrucțiunii CALL, adresa de retur este împinsă în stivă Prin urmărire, puteți determina că această adresă este x Anexa B Programare în limbaj de asamblare Prima comandă din subrutină este PUSH Se execută pentru indicatorul de bază (BP) de pe linia Valoarea BP este reținută deoarece acest registru va fi necesar pentru a aborda argumentele și variabilele locale ale acestei subrutine Mai mult, în linia , indicatorul de stivă este copiat în registrul BP; astfel, noua valoare a indicatorului de bază specifică valoarea veche a indicatorului de stivă După aceea, totul este gata pentru a încărca argumentele în registre și pentru a rezerva spațiu pentru o variabilă locală Următoarele trei linii scot argumentele pe rând din stivă și le plasează într-un registru După cum vă amintiți, stiva este optimizată pentru stocarea cuvintelor, ceea ce înseamnă că adresele trebuie să fie egale Adresa de retur urmează imediat indicatorul de bază vechi și, prin urmare, este accesată ca (BP) Următorul argument este count - (VR) Este încărcat în registrul CX de pe linia Pe liniile și , vectorii veci și vec sunt încărcați în registrele SI și, respectiv, DI Pentru a stoca rezultatul intermediar, această rutină are nevoie de o variabilă locală cu o valoare inițială de În acest sens, în linia , valoarea este împinsă în stivă Starea procesorului chiar înainte de prima iterație a buclei, începând cu linia , este prezentată în Figura LA Fereastra îngustă din mijlocul părții superioare (în dreapta registrelor) arată zona stivei În partea de jos este adresa ѵес ( x ); apoi, în ordine crescătoare, urmează adresa veci ( x ) și al treilea argument care exprimă numărul de elemente din fiecare vector ( x ) Apoi este specificată adresa de retur ( x ) Numărul din stânga acestei adrese indică faptul că este o adresă de retur la un nivel distanță de programul principal În caseta de sub registre apare și numărul , dar de data aceasta reprezintă o adresă simbolică Deasupra adresei de retur de pe stivă este vechea valoare a BP ( x fc ) și zero, împinsă pe stivă pe linia Săgeata care indică această valoare reflectă poziția pointerului stivei (registrul SP) Fereastra din dreapta secțiunii stivei arată o bucată de text de program; săgeata de aici indică următoarea comandă în ordinea execuției MOV BP SP PUSHvec PUSH veci MOV CX,vec -vec I ! ! ! CS: DS=SS=ES => PUSH BP ! ! I I AH: AL: AX: BH: BL: BX: CH: CL: CX: MOV MOV MOV BP SP CX, (BP) SI, (BP) SHR CX, ! DH: DL: DX: fc MOV DI, (BP) I PUSHCX I SP: fb SF ODSZC PUSHO I Apelați vecmul ! BP: fb CC -> pz - => : LODS I - SI: IP:OO : PC MUL (Dl) ! vecmul: I Dl: vecmul+ ADD - (BP),AX I IMPINGAȚI BP! MOV BP,SP ! eu MOV CX, (BP) ! PUSH I vec + = : b : LODS! vec + = : MUL (DL) ! pfmt+O = : e The in prod ADD - (BP),AX I pfmt+ = : a % d I ADAUGĂ Dl, BUCLA b! Orez LA Conținutul ferestrei de urmărire pentru programul vecprod s când este atinsă linia , dar înainte de începerea buclei Exemple Acum luați în considerare bucla care începe la linia Instrucțiunea LODS încarcă cuvântul de memorie din segmentul de date în AX prin registrul SI Deoarece steag-ul de direcție este setat, instrucțiunea LODS este executată în modul de auto-incrementare, ceea ce înseamnă că după finalizare, registrul SI indică următorul element al veci Pentru a reprezenta grafic acest mecanism, rulați comanda tracer t vecprod Când apare fereastra de urmărire, introduceți următoarea comandă: /vecmul+ b Apoi apăsați tasta de retur caruș, setând astfel un punct de întrerupere pe linia care conține comanda LODS (Nu vă vom reamintim mai târziu că trebuie să apăsați tasta de întoarcere la cărucior după toate comenzile ) Introduceți comanda g Ca rezultat al executării acestei comenzi, urmăritorul va executa comenzi până la punctul de control În acest caz, se va opri la linia care conține comanda LODS Pe linia , valoarea lui AX este înmulțită cu operandul original Cuvântul de memorie asociat cu instrucțiunea MUL este selectat din segmentul de date utilizând registrul DI folosind adresarea indirectă a registrului Adresa țintă implicită (nespecificată în instrucțiune) a instrucțiunii MUL este combinația de registre DX : AX Linia adaugă rezultatul la variabila locală situată pe stiva la adresa - (BP) Deoarece instrucțiunea MUL nu își auto-incrementează operandul, această acțiune este efectuată în mod explicit pe linia Registrul DI indică apoi următoarea intrare, wec Etapa curentă a programului se încheie cu comanda LOOP Valoarea registrului CX este incrementată negativ, iar dacă după aceea rămâne pozitivă, programul sare la eticheta locală pe linia Eticheta locală b înseamnă căutarea celei mai apropiate etichete în direcția opusă poziției curente Când bucla se termină, subrutina introduce valoarea returnată din stivă în registrul AX (linia ), restabilește valoarea BP (linia ) și revine la programul de apelare (linia ) După apel, execuția programului principal este reluată cu instrucțiunea MOV (sărire la linia ) Această comandă deschide o secvență de cinci comenzi menite să afișeze rezultatul Apelul de sistem printf este modelat după funcția printf a bibliotecii de programare standard C Liniile - împing argumente pe stivă: valoarea întreagă care trebuie tipărită, adresa șirului de format (pfmt) și codul funcției printf ( ) Șirul de format pfmt conține simbolul £d, indicând că variabila întreagă necesară pentru formatare este argumentul apelului printf Pe linia , stiva este curățată Deoarece începutul programului este pe linia , unde pointerul stivei a fost stocat în registrul pointerului de bază, puteți rula la fel de bine comanda pentru a șterge stiva MOV SP BP Anexa B Programare în limbaj de asamblare Avantajul acestei soluții este că programatorul nu trebuie să țină evidența stivei În cazul programului principal, acest lucru nu este foarte important, dar atunci când lucrați cu subrutine, această abordare vă permite să scăpați de datele inutile, cum ar fi variabilele locale învechite Subrutina vecmul poate fi inclusă în alte programe Dacă numele fișierului sursă vecprod s este plasat pe linia de comandă înaintea numelui altui fișier sursă în limbaj de asamblare, acesta din urmă poate apela rutina pentru înmulțirea a doi vectori cu lungime fixă Pentru a evita duplicarea, se recomandă mai întâi să excludeți definițiile constantelor EXIT și PRINTF Dacă fișierul antet syscalnr h este inclus, nu este nevoie să scrieți definiții constante de apel de sistem în altă parte Depanarea unui program de ieșire Array Programele discutate în exemplele anterioare sunt simple și nu conțin erori În acest exemplu, vom arăta cum un traser poate ajuta la depanarea programelor cu erori Următorul nostru program este să scoatem un tablou întreg definit după eticheta veci Există erori în versiunea ei originală Pentru a le identifica, vom folosi un asamblator și un trasor, dar mai întâi vom discuta despre cod Deoarece apelurile de sistem și, prin urmare, constantele prin care aceste apeluri pot fi distinse prin numere, sunt necesare oricărui program, am separat definițiile constantelor cu aceste numere într-un fișier antet separat, care este inclus în codul din prima linie : # psuda " /syscalnr h" Printre altele, acest fișier definește constante pentru următorii descriptori de fișiere: STDIN=O STDOUT= STDERR= Acestea se deschid la începutul procesului, iar antetul conține etichete care indică secțiuni de text și date Este logic să includeți acest fișier în antetul tuturor fișierelor de asamblare sursă, deoarece definițiile din el sunt foarte solicitate Dacă codul sursă este răspândit pe mai multe fișiere, asamblatorul include o singură versiune a fișierului antet, evitând astfel situația definițiilor multiple ale constantelor Programul arrayprt este prezentat în Lista B Codul nu este comentat deoarece presupunem că până acum cititorul este deja destul de familiarizat cu setul de instrucțiuni În linia , adresa stivei goale este plasată în registrul indicatorului de bază - aceasta oferă posibilitatea de a șterge stiva prin copierea pointerului de bază la pointerul stivei, ceea ce se face în linia În exemplul anterior (linii - ), am luat în considerare deja situația calculării și introducerii în teanc de argumente înainte de apel Liniile - încarcă registrele în subrutină Exemple Listarea B , Programul arrayprt înainte de depanare # nclude " /syscalnr h" ! SECT TEXT vecpstrt: ! ! MOV BP SP PUSH veci MOV CX frmatstr-vecl SHR CX PUSH CX CALL vecprint MOV SP BP PUSHO PUSH EXIT SYS ! ! ! ! ! ! ! ! unsprezece! ! SECT DATE veci: WORD , , , frmatstr: ASCIZ "£s" ! ! ! frmatkop: ! ASCIZ "Matricea conține " frmatlnt: ASCIZ " £d" ! ! SECT TEXT vecprint: ! ! PUSH BP MOV BP SP MOV CX (BP) MOV BX b(BP) MOV SI O PUSH frmatkop PUSH frmatstr PUSH PRINTF SYS MOV - (BP) frmatlnt : MOV DI (BX)(SI) MOV - (BP),DI SYS INC SI LOOP b PUSH '\n' PUSH PUTCHAR SYS MOV SP BP RET ! ! ! ! ! ! ! ! ! treizeci! ! ! ! ! ! ! ! ! ! ! Liniile - ale codului arată cum să tipăriți un șir de caractere, iar liniile - apelează apelul de sistem printf pe o valoare întreagă Adresa unui șir de caractere este împinsă în stivă la linia , iar la linia o valoare întreagă este împinsă în stivă În ambele cazuri, adresa șirului de format este primul argument al comenzii PRINTF Liniile - scot un singur caracter folosind apelul de sistem putchar Acum să încercăm să asamblam și să rulăm programul Pentru a face acest lucru, introduceți comanda as arrayprt s Anexa B Programare în limbaj de asamblare Acest lucru are ca rezultat un mesaj de eroare de operand pe linia din arrayprt s Acest fișier este generat de asamblator prin concatenarea fișierelor include cu fișierul sursă; este fișierul rezultat care este procesat de asamblator Mesajul de eroare se referă la linia a acestui fișier îmbinat Examinarea liniei a fișierului arrayprt s nu va da nimic - numerotarea liniei din cele două fișiere nu se potrivește din cauza includerii liniilor de fișier antet în fișierul arrayprt S Linia din arrayprt s corespunde liniei din arrayprt s deoarece fișierul antet inclus syscalnr h conține de linii Pe UNIX, puteți căuta linia în arrayprt s tastând head - arrayprt s Această comandă tipărește primele de linii ale fișierului combinat În consecință, eroarea trebuie căutată în linia de jos a listării Un efect similar poate fi obținut prin vizualizarea fișierului îmbinat într-un editor de text Astfel, localizam eroarea pe linia a programului original, care contine instructiunea SHR Studiind tabelul B problema este ușor de detectat: am uitat să specificăm valoarea offset-ului Linia după corecție ar trebui să arate astfel: SHR SH, Este important de reținut că eroarea trebuie corectată în fișierul arrayprt s și nu în fișierul arrayprt $ concatenat, deoarece acesta din urmă este actualizat automat de fiecare dată când se rulează asamblatorul Următoarea încercare de a asambla codul sursă, în teorie, ar trebui să reușească Apoi pornim trasorul cu comanda t arrayprt În timpul urmăririi, observăm că rezultatul nu se potrivește cu vectorul din segmentul de date Vectorul conține valorile , , , și , în timp ce secvența de ieșire începe la , , În mod clar, ceva nu este în regulă Pentru a găsi eroarea, trasorul poate fi repornit și poate urmări starea mașinii pas cu pas până când apare o valoare incorectă Valorile care trebuie să fie scoase sunt stocate în memorie pe liniile și Linia de ieșire nevalidă este un loc bun pentru a începe să căutați La a doua trecere a buclei, devine observabil că valoarea numerică a SI este impară, ceea ce nu ar trebui să fie prin definiție, deoarece indexarea se face prin cuvinte, nu pe octeți Astfel, problema se află pe linia Valoarea SI din aceasta este incrementată cu unu, în timp ce incrementul corect este Pentru a corecta eroarea, linia trebuie schimbată după cum urmează: ADAUGĂ După corectare, lista de numere afișată nu ridică nicio reclamație Cu toate acestea, ne confruntăm cu o altă eroare După ce apelul la vecprint se termină și returnează o valoare, urmăritorul marchează o eroare în pointerul stivei Soluția evidentă este să verificați dacă valoarea introdusă în stivă atunci când este apelată vecprint este aceeași cu valoarea de deasupra stivei atunci când executați co Exemple RET solicită pe linia După cum se dovedește, nu se potrivesc Deci linia ar trebui înlocuită cu două linii noi: ADAUGĂ SP POP BP Prima comandă elimină cuvinte împinse pe stivă în timpul apelului la vecprint; aceasta accesează valoarea BP stocată pe linia Prin scoaterea acestei valori din stivă, restabilim valoarea registrului BP înainte de apel și obținem adresa corectă de retur Acum programul se iese corect Nu este un secret că depanarea codului de limbaj de asamblare este mai mult o artă decât o știință, dar nu neglijați ajutorul unui trasor, care simplifică foarte mult procesul Procesarea șirurilor de caractere și comenzi cu șir Scopul principal al acestei subsecțiuni este de a arăta mecanismul de gestionare a comenzilor șir repetate Listările B și B prezintă programe simple de procesare a șirurilor de caractere, strngcpy s și reverspr s, aflate în folderul de exemple Lista B- - Copierea unui șir (strngcpy s) SECT TEXT stcstart: ! PUSH mesaje! PUSH meg ! Apelați strngcpy! ADAUGĂ SP ! împinge ! IMPINGAȚI ! SYS! strngpy: ! PUSH CX! PUSH SI ! unsprezece PUSH DI! PUSH BP! MOV BP SP ! MOV AX O ! MOV DI, (BP) ! MOV CX - ! REPNZ SCASB! NEGCX ! DECCX ! MOV SI IO(BP) ! MOV DI, (BP) ! PUSH DI! REP MOVSB ! Apelați strlngpr! MOV SP BP ! POP BP! POP DI! POP S! POP CX! treizeci RET! Anexa B Programare în limbaj de asamblare SECT DATE ! mesgl: ASCIZ "Aruncă o privire\n" ! mesg : ASCIZ "qrstXn" ! SECT BSS Lista B - Ieșirea șirurilor de caractere înapoi (reverspr s) # nclude " /syscalnr h" ! începe: MOV Dl str ! IMPINGE SEORUL! MOV BP SP ! PUSH -PUTCHAR ! MOVBAL 'Xn' ! MOV CX -l ! REPNZ SCASB! NEGCX ! STD! DECCX ! unsprezece SUB DI, ! MOV SI,DI ! : LODSB! MOV(BP) AX ! SYS! BUCLA b! MOVB (BP),'\n' ! SYS! IMPINGE O! PUSH EXIT ! SYS! SECT DATE ! str: ASCIZ "invers\n" ! Lista B arată programul de copiere a șirurilor Apelează subrutina stringpr, care poate fi găsită și într-un fișier separat stringpr s (acest fișier nu este listat în aplicația noastră) Pentru a asambla un program care conține subrutine în fișiere separate, toate fișierele sursă trebuie specificate în comanda as , începând cu programul principal, care determină numele fișierelor executabile și auxiliare De exemplu, pentru a asambla programul prezentat în listarea B , introduceți comanda as strngcpy s stringpr s Programul din Lista B scoate șiruri de caractere în ordine inversă Ne vom uita pe rând la ambele programe În Lista B , liniile de cod sunt numerotate, începând cu prima etichetă Programul principal (liniile - ) începe prin apelarea subrutinei strngcpy cu două argumente: șirul sursă mesg și șirul țintă mesgl; subprogramul copiază conținutul primului în al doilea Acum să aruncăm o privire mai atentă la subrutina strngcpy care începe pe linia a codului Se așteaptă ca adresele bufferului țintă și ale șirului sursă să fie împinse în stivă chiar înainte de a fi apelată În rândurile - , registrele implicate sunt salvate prin împingerea valorilor lor pe stivă; mai târziu, în liniile - , se presupune că vor fi restaurate În linia , valorile SP și BP sunt copiate prin metoda standard După aceea, argumentele pot fi încărcate în VR În linia , stiva este șters în modul cu care suntem deja familiarizați - valoarea BP este copiată în SP Exemple Locația centrală a subrutinei este instrucțiunea REP MOVSB, situată pe linia a codului Instrucțiunea MOVSB mută octetul indicat de registrul SI la adresa de memorie specificată de registrul DL După aceea, conținutul ambelor registre este mărit cu unul Instrucțiunea REP formează un ciclu în care este executată instrucțiunea MOVSB; după mutarea fiecărui octet, scade valoarea lui CX cu Bucla se termină când CX ajunge la zero Înainte de executarea REP MOVSB trebuie pregătite registrele, ceea ce se face în rândurile - Indicele sursă, SI, este copiat din argument pe stiva de pe linia ; indicele de destinație, DI, este definit pe linia Obținerea valorii CX este ceva mai dificilă Rețineți că sfârșitul unui șir de caractere este indicat de un octet nul Instrucțiunea MOVSB nu afectează starea steagului zero, spre deosebire de instrucțiunea SCASB (byte string scan) Acesta din urmă compară valoarea indicată de DI cu valoarea AL și crește DI din mers La fel ca MOVSB, este una dintre comenzile repetitive Linia șterge registrele AX și A L, linia scoate un indicator către DI din stivă, iar linia inițializează registrul CX la - Linia conține instrucțiunea REPNZ SCASB, care efectuează o operație de comparare în contextul unei bucle și, dacă este egală, setează steag-ul zero Cu fiecare trecere a buclei, CX este decrementat, iar când steag-ul zero este setat, bucla se oprește - instrucțiunea REPNZ verifică atât steag-ul zero, cât și CX Numărul de treceri de buclă cu instrucțiunea MOVSB este astfel definit ca diferența dintre valoarea curentă CX și valoarea anterioară - (liniile - ) Folosirea a două comenzi repetate nu este foarte elegantă, dar acesta este prețul unei decizii de proiectare bazată pe principiul independenței codurilor de condiție față de comenzile de mutare Când sunt executate bucle, registrele de index sunt incrementate, iar în acest scop indicatorul de direcție trebuie șters Pe rândurile și ale codului, șirul de caractere copiat este afișat folosind rutina stringpr găsită în folderul exampLes Este destul de simplu, așa că nu vom discuta aici În programul de ieșire șir de caractere prezentat în Lista B , rândul al codului conține toate numerele standard de apel de sistem Pe linia , o valoare inactivă este împinsă pe stivă, iar pe linia , indicatorul de bază (BP) începe să indice vârful curent al stivei Acest program scoate caracterele ASCII pe rând, astfel încât valoarea numerică PUTCHAR este împinsă în stivă Rețineți că BP indică simbolul care ar trebui să fie afișat în timpul apelului SYS Rândurile , și pregătesc registrele DI, AL și CX pentru execuția instrucțiunii SCASB repetate Registrul de contor și indexul țintă sunt încărcate în același mod ca în programul de copiere a liniilor, cu excepția faptului că un caracter newline este plasat în registrul AL în loc de zero Astfel, instrucțiunea SCASB compară valorile caracterelor șirului str cu \n, nu zero, și setează bitul zero dacă se potrivește Instrucțiunea REP SCASB incrementează registrul DI astfel încât, după o potrivire, indexul țintă indică caracterul nul care urmează noului caracter Anexa B Programare în limbaj de asamblare linii Linia crește DI cu ; ca urmare, acest registru indică ultima literă a cuvântului Dacă șirul de caractere este scanat în ordine inversă și este afișat caracter cu caracter, atunci sarcina noastră este rezolvată; într-un astfel de caz, indicatorul de direcție de pe linia este resetat și registrele de index din instrucțiunile șirului sunt ajustate înapoi Acum comanda LODSB de pe linia copiază caracterul în AL, iar pe linia caracterul este împins pe stiva de lângă PUTCHAR, permițând comenzii SYS să-l afișeze Comenzile de pe liniile și scot o linie nouă, iar programul este în mod tradițional terminat prin apelarea EXIT Versiunea actuală a programului, totuși, conține o eroare Acesta poate fi găsit prin urmărirea pas cu pas Comanda /str plasează șirul str în câmpul de date al trasorului Deoarece valoarea numerică a adresei datelor este cunoscută, ne putem da seama cum se schimbă valorile din registrele de index în raport cu poziția șirului de caractere Eroarea, însă, este descoperită numai după apăsarea repetă a tastei de întoarcere a căruciorului Comenzile de urmărire ajută la reducerea timpului de localizare a erorilor Rulați programul de urmărire și introduceți comanda , care ne va muta la mijlocul buclei Apoi, utilizați comanda b pentru a seta un punct de întrerupere pe linia Prin crearea a două linii noi, vom vedea că ultima literă "e" este afișată în câmpul de ieșire Prin rularea comenzii r, vom face ca programul de urmărire să ruleze până la următorul punct de control sau până la încheierea procesului Astfel, rulând comanda r în secvență, puteți vedea toate literele până ajungem la soluția problemei Din acest moment, programul de urmărire poate fi comutat într-un mod pas cu pas și poate analiza ce se întâmplă la executarea celor mai importante comenzi De asemenea, putem seta un punct de întrerupere suplimentar pe o anumită linie de cod, dar acest lucru trebuie să țină cont de includerea fișierului syscalnr h, ceea ce duce la o schimbare a numerelor de linii ale codului cu Prin urmare, pentru a seta un punct de întrerupere pe, de exemplu, linia , trebuie să introducem comanda b Cu toate acestea, este mai bine să abandonați acest mod neîndemânatic în favoarea setării etichetei globale a începutului pe linia înainte de comanda situată în ea - atunci punctul de întrerupere din linia de cod dorită poate fi setat cu comanda /start+ b În plus, acest mod de a seta un punct de întrerupere vă permite să ignorați dimensiunea fișierului inclus Tabele de expediere Unele limbaje de programare au instrucțiuni select care vă permit să selectați una dintre mai multe opțiuni posibile în funcție de valoarea numerică a unei variabile Acest tip de ramificare multivariată este uneori utilă în programele în limbaj de asamblare Luați, de exemplu, un set de rutine de apeluri de sistem incluse într-un dispozitiv de captare a excepțiilor SYS Exemplu de programare multivariată Exemple Ramificarea antenei în limbajul de asamblare este prezentată în codul jumptbLs din Listarea B Listarea B - Implementarea ramificării multivariate cu un tabel expediere # nclude " /syscalnr,h" ! SECT TEXT ! jumpstrt: ! PUSH strt! MOV BP SP ! PUSH -PRINTF ! SYS! PUSH -GETCHAR ! : SYS! CMP AX ! JL f! unsprezece CMPB AL ' ' ! JL b! CMPB AL ' ' ! JLE f! MOVB AL ' '+l ! : MOV BX AX ! SI BX OXf ! SAL BX l ! Apelați tbl(BX) ! JMP b! : APĂSĂ ! PUSH-EXIT! SYS! routeO: MOV AX mesO ! JMP f! ruta: MOV AX mesl ! JMP f! ruta : MOV AX mes ! JMP f! treizeci ruta : MOV AX, mes ! JMP f! ruta : MOV AX,mes ! JMP f! ruta : MOV AX, mes ! JMP f! ruta : MOV AX mes ! JMP f! ruta : MOV AX,mes ! JMP f! ruta : MOV AX,mes ! JMP f! erut: MOV AX ernes ! : IMPINGE SEORUL ! PUSH -PRINTF ! SYS! ADAUGĂ SP ! RET! SECT DATE ! tbl: WORD routO routl rout rout ,rout ,rout , rout ,rout rout rout ,erout ! mesO: ASCIZ "Acesta este un zeroAn" ! mesl: ASCIZ "Ce zici de unul \n" ! Anexa B Programare în limbaj de asamblare mes : ASCIZ "Ai cerut un doiAn" ! mes : ASCIZ "Dlglt era un treiAn" ! mes : ASCIZ "Ai tastat un fourAn" ! mes : ASCIZ "Ai preferat un flveAn" ! mes : ASCIZ "A fost întâlnit un slxAn" ! mes : ASCIZ "Acesta este numărul șapteAn" ! mes : ASCIZ "Acest dlglt nu este acceptat ca An octal" ! emes: ASCIZ "Asta nu e un dlglt Încearcă agalnAn" ! strt: ASCIZ "Type an octal dlglt wlth a return Stop on the end of file An"! Programul începe prin a scoate un șir de caractere a cărui etichetă (strt) solicită utilizatorului să introducă o cifră octală (liniile - ale codului) Un caracter este apoi citit din fișierul de intrare standard (liniile și ) Dacă AX este mai mic de , programul interpretează acest lucru ca un marcator de sfârșit de fișier, trece la eticheta pe linia și iese cu codul de stare Dacă caracterul introdus nu este un marcator de sfârșit de fișier, caracterul introdus în registrul AL este examinat Orice caracter mai mic decât cifra este considerat un delimitator și este ignorat la introducerea liniei de cod ; după care se extrage următorul caracter Orice caracter mai mare de este considerat nevalid Pe linia , este convertit în caracterul ASCII două puncte, care vine imediat după în secvența de caractere ASCII Astfel, pe linia , registrul AX conține o valoare între și două puncte Această valoare este copiată în registrul BX Pe linia , comanda AND maschează toți biții, cu excepția celor mai puțin semnificativi, lăsând un număr între și (deoarece codul ASCII x corespunde cu zero) Deoarece vom indexa cuvintele din tabel, nu octeții, valoarea BX este înmulțită cu prin deplasarea la stânga în rândul Linia conține comanda de apel Adresa reală este determinată prin adăugarea valorii BX la valoarea numerică a etichetei tbl, iar conținutul acestei adrese combinate este încărcat în contorul de programe al computerului Programul selectează una dintre cele zece subrutine, în funcție de caracterul pe care îl preia din intrarea standard Fiecare dintre aceste subrutine plasează adresa unui anumit mesaj pe stivă și apoi trece la apelul comun al rutinei de sistem PRINTF pentru toți Pentru a înțelege ce se întâmplă, trebuie avut în vedere că instrucțiunile JMP și CALL încarcă o anumită adresă a unui segment de text în registrul PC-ului Această adresă este un număr binar, iar în timpul asamblarii, toate adresele sunt înlocuite cu valorile binare corespunzătoare Valorile binare, la rândul lor, ajută la inițializarea matricei în segmentul de date, ceea ce se face pe linia Astfel, matricea care începe la eticheta tbl conține adresele de pornire ale rutinelor routO, routl, rout etc , doi octeți pentru fiecare fiecare Prezența adreselor de octeți explică necesitatea unei deplasări de bit făcută în linia Tabelele de acest tip sunt adesea numite tabele de expediere Mecanismul de funcționare a unor astfel de programe este demonstrat de subrutina erout (liniile - din cod) Se ocupă de numere care sunt în afara intervalului Mai întâi, linia împinge adresa mesajului (în AX) în stivă Numărul apelului de sistem PRINTF este apoi împins în stivă Apoi, apelul de sistem este executat, stiva este șters și programul revine Celelalte zece rutine - de la routeO la route - încarcă adresele mesajelor lor Exemple la registrul AX, apoi mergeți la a doua linie de erupție, tipăriți mesajele și terminați subrutina O modalitate de a adapta un program pentru a trimite tabele este de a-l modifica astfel încât să se formeze un mesaj semnificativ din caracterele introduse De exemplu, toate caracterele, altele decât cifrele octale, pot constitui un mesaj de eroare Acces la fișiere tamponat și aleatoriu Programul InFilBuf s prezentat în Lista B este un exemplu de I/O de fișier arbitrar Permite unui fișier să fie compus dintr-un număr arbitrar de șiruri de caractere, fiecare dintre ele potențial diferit ca lungime de celelalte Acest program citește mai întâi fișierul și construiește un tabel în care intrarea n reflectă poziția începutului liniei n din fișier Puteți apoi să căutați un anumit șir de caractere, să găsiți o intrare pentru acesta în tabel și să îl citiți folosind apelurile de sistem de căutare și citire Numele fișierului de intrare standard este specificat pe prima linie de intrare Programul constă din mai multe fragmente de cod relativ independente care pot fi adaptate în alte scopuri Listarea B Un program care implementează accesul în buffer și aleatoriu la un fișier # psijude " /syscalnr h" ! bufslz= SECT TEXT ! infbufst: ! MOV BP SP ! MOV Dl llnein! PUSH -GETCHAR ! : SYS! CMPBAL 'Xn' ! JL f! J E Dacă! unsprezece STOSB! JMP b! : APĂSĂ ! PUSH llneln! PUSH OPEN ! SYS! CMP AX O ! JL f! MOV (fildeș),AX ! MOV SI, nh+ ! MOV BX O ! : CALL fi buf ! CMP CX, ! JLE f ! : MOVBAL 'Xn' ! REPNE SCASB! JNE b! INC (număr) ! MOV AX BX ! treizeci Anexa B Programare în limbaj de asamblare SUB AH, SH! XCHG SI,DI ! STOS! XCHG SI,DI ! CMP CX, ! JNE b! JMP b! : MOV SP BP ! PUSH llnein! PUSH mesaj! PUSH PRINT! SYS! IMPINGA IESIREA! IMPINGA IESIREA! SYS! : Apelați getnum ! CMP AX, ! JLE f ! MOV BX (curlin) ! CMP BX, ! JLE f ! CMP BX (număr) ! JG f! SHL BX, ! MOV AX, linh- (BX) ! MOV CX linh(BX) ! împinge ! împinge ! IMPINGE SEORUL! PUSH (fildeș) ! IMPINGAȚI LSEEK! SYS! SUB CX AX ! PUSH CX! PUSH buff! PUSH (fildeș) ! PUSH CITEȘTE! SYS! ADAUGĂ SP, ! IMPINGAȚI ! PUSH SCRIE! SYS! ADAUGĂ SP ! JMP b! : PUSH scaner! PUSH PRINT! SYS! ADAUGĂ SP, ! JMP b! : IMPINGAȚI ! IMPINGA IESIREA! SYS! fillbuf: ! Îmbunătății de PUSH! PUSH buff! PUSH (fildeș) ! PUSH CITEȘTE! SYS! ADDSP, ! Exemple MOV CX AX ! ADAUGĂ BX CX! MOV DI,buf ! RET! getnum: ! MOV DI, Inein! IMPINGA GETCHAR! : SYS! CMPBAL,'\n' ! JL b! J E Dacă! STOSB! JMP b! : MOVB (DI),' ' ! PUSH curlin! PUSH numfmt ! PUSH line! PUSH SSCANF! SYS! ADAUGĂ SP, ! RET! SECT DATE ! Err:! ASCIZ "Deschide fa ed\n" ! numfmt: ASCIZ ' d" ! scaner: ! ASCIZ "Tastați un numărAn" ! ALIGN ! SECT BSS ! linein: SPAȚIU ! câmpuri: SPACE ! llnh: SPAȚIU ! curlin: SPACE ! buf: SPACE bufslz+ ! count: SPACE ! Primele cinci linii de cod definesc numerele de apel de sistem și dimensiunea bufferului și setează indicatorul de bază în partea de sus a stivei, ca de obicei Rândurile - citesc numele fișierului de la intrarea standard și îl stochează pe un șir de caractere etichetat linein Dacă numele fișierului nu este închis de o linie nouă, este afișat un mesaj de eroare și procesul se termină cu o stare diferită de zero Toate aceste acțiuni sunt reflectate în rândurile - Rețineți că adresa numelui fișierului este împinsă în stiva pe linia , iar adresa mesajului de eroare este împinsă pe linia Mesajul de eroare în sine (reprezentat pe linia FROM) este o solicitare PRINTF pentru șirul $s Tot aici este introdus și conținutul linein În cazul copierii cu succes a numelui fișierului, acesta este deschis în rândurile - Dacă apelul deschis eșuează, valoarea returnată devine negativă și sare la eticheta pe linia pentru a afișa mesajul de eroare Acest ghid va fi necesar la apelurile ulterioare de citire și căutare Anexa B Programare în limbaj de asamblare Apoi, fișierul este citit în blocuri de octeți, fiecare dintre acestea fiind stocat în buffer-ul De fapt, doi octeți mai mult decât cantitatea necesară ( octeți) sunt alocați pentru buffer, dar acest lucru se face doar pentru a arăta cum o constantă simbolică și un număr întreg pot fi plasate într-o expresie (linia ) În mod similar, în linia , adresa următorului element al matricei linh este încărcată în registrul SI, ca urmare, un cuvânt de mașină cu valoare zero rămâne în partea de jos a matricei Registrul BX primește adresa de fișier a primului caracter necitit din fișier, ceea ce înseamnă că este inițializat la zero pe linia înainte ca tamponul să fie prima umplut Subrutina fi buf, situată în liniile - , este responsabilă pentru umplerea bufferului După ce argumentele de citit sunt introduse în stivă, se face o cerere de apel de sistem care plasează numărul de caractere citite efectiv în registrul AX Acest număr este copiat în CX, iar ulterior valoarea acestui registru poate fi folosită pentru a afla numărul de caractere rămase în buffer Poziția fișierului primului caracter necitit este stocată în registrul BX, iar pe linia valoarea CX este adăugată la valoarea BX Linia plasează partea de jos a tamponului în DI; pregătindu-se astfel să scaneze tamponul pentru următorul caracter newline După revenirea fiii buf, linia verifică dacă au fost citite de fapt vreun caracter Dacă răspunsul este nu, bucla de citire tamponată trece la a doua parte a programului de pe linia După aceea, începe navigarea în buffer Caracterul \n este încărcat în registrul AL de pe linia , iar pe linia următoare, această valoare este căutată în bucla REP SCASB și comparată cu caracterele din buffer Ieșirea din buclă poate avea loc în două cazuri: când valoarea din registrul CX este zero sau când caracterul căutat este un caracter newline Când steag-ul zero este setat, ultimul caracter scanat este \n, iar poziția în fișier a caracterului curent (situat după linia nouă) este stocată în tabloul Hnh În continuare, contorul este incrementat, iar poziția în fișier este determinată de valoarea lui BX și de numărul de caractere rămase în CX (liniile - ale codului) Liniile - stochează, dar deoarece adresa țintă pentru instrucțiunea STOS nu este registrul SI, ci registrul DI, aceste registre sunt schimbate înainte și după apelarea instrucțiunii STOS În rândurile - se verifică datele rămase în buffer, după care, în funcție de valoarea lui CX, se efectuează o tranziție Ajunși la finalul dosarului avem la dispoziție o listă completă a pozițiilor din dosarul elementelor inițiale ale rândurilor Deoarece matricea linh începe la cuvântul zero, știm că prima linie începe la adresa , următoarea linie este la poziția linh + și așa mai departe Mărimea unui șir n poate fi calculată scăzând adresa de pornire a șirului n de la adresa de pornire a șirului n + Restul programului citește numărul șirului de caractere, trece acel șir în buffer și apoi îl imprimă cu apelul de scriere Toate datele necesare pentru a efectua aceste operații se află în matricea linh, unde fiecare a n-a intrare conține poziția de pornire a liniei n din fișier Dacă numărul șirului de caractere solicitat este zero sau în afara intervalului, programul se încheie prin sărirea la eticheta Această parte a programului începe cu un apel către subrutina getnum (linia a codului) Citește un șir de caractere de la intrarea standard și stochează Întrebări și sarcini în buffer-ul linein (liniile - din cod) În continuare, apelul SSCANF este pregătit Având în vedere ordinea inversă a argumentelor, adresa buffer-ului curlin este împinsă mai întâi pe stivă, unde poate fi plasată o valoare întreagă, apoi adresa șirului de format pentru reprezentarea întregului numfmt și, în final, adresa buffer-ului linein , care conține numărul în reprezentare zecimală Dacă este posibil, rutina sistemului SSCANF pune valoarea binară în curlin În caz de eroare, returnează valoarea zero AX Verificarea valorii returnate se face pe linia ; în caz de eroare, programul generează un mesaj de eroare prin eticheta Dacă rutina getnum returnează o valoare întreagă validă în curlin, aceasta este mai întâi copiată în BX În continuare, această valoare este verificată dacă aparține intervalului valid (liniile - din cod) Dacă numărul liniei se află în afara acestui interval, are loc ieșirea (EXIT) Apoi, trebuie să determinați poziția finală a acestei linii în fișier și numărul de fișiere care trebuie citite; în acest scop, valoarea BX este înmulțită cu prin deplasarea la stânga (SHL) Pe linia , poziția șirului de caractere curent din fișier este copiată în registrul AX Poziția următorului șir de caractere este apoi plasată în registrul CX, iar numărul de octeți din șirul curent este calculat din aceasta Pentru a citi aleatoriu date dintr-un fișier, se folosește apelul de căutare ; setează offset-ul la octetul care ar trebui să fie citit în continuare Căutarea subrutinei este executată relativ la începutul fișierului și, prin urmare, pe linia , un argument nul este împins în stivă Următorul argument este offset-ul din fișier Prin definiție, acest argument este un întreg lung ( de biți), astfel încât cuvântul nul este împins mai întâi în stivă, urmat de valoarea lui AX (liniile și ale codului); aceasta formează o valoare întreagă de de biți Apoi, la linia , descriptorul de fișier și codul LSEEK sunt împinse în stivă și apelul este efectuat Valoarea returnată a lui LSEEK specifică poziția curentă în fișier și poate fi găsită în combinația de registru DX: AX Dacă numărul se încadrează într-un cuvânt de mașină (și dimensiunea fișierului nu depășește de octeți, nu poate fi altfel), adresa este plasată în AX; prin urmare, dacă scădem valoarea acestui registru din CX (linia ), obținem numărul de octeți care trebuie citiți pentru a pune linia în buffer Orice altceva este foarte simplu Liniile - citesc o linie dintr-un fișier și apoi utilizați descriptorul de fișier de pe liniile - pentru a-l scrie la ieșirea standard Rețineți că, după curățarea parțială a stivei, care are loc pe linia , valorile contorului și buffer-ului rămân pe stivă În cele din urmă, pe linia , indicatorul stivei este complet resetat, urmat de un salt înapoi la eticheta și un alt apel la getnum Întrebări și sarcini Care sunt valorile registrelor AH și AL după executarea instrucțiunii MOV AX, ? Valoarea registrului CS este Care este intervalul de adrese de memorie absolută în acest segment de cod? Anexa B Programare în limbaj de asamblare Care este adresa maximă de memorie pe care o poate accesa Să presupunem că CS = , DS = și IP = ) Care este adresa absolută a următoarei instrucțiuni? ) Ce cuvânt de memorie este încărcat în registrul AX la executarea instrucțiunii MOV AX, ( )? Subrutina cu trei argumente întregi este apelată conform secvenței de apelare descrisă în această anexă - programul de apelare împinge argumentele în ordine inversă pe stivă și apoi execută instrucțiunea CALL Programul apelat salvează apoi valoarea anterioară a BP și introduce o nouă valoare care indică cea veche Apoi, indicatorul stivei este incrementat negativ; alocând astfel spațiu pentru plasarea variabilelor locale Având în vedere această secvență, denumește instrucțiunea necesară pentru a muta primul argument în registrul AX În fig ÎN operandul este expresia de - hw Această valoare exprimă diferența dintre cele două etichete Există o situație în care de + hw ar putea fi operandul real? Justificati raspunsul Scrieți codul în limbaj de asamblare pentru a evalua următoarea expresie: x = a + b + O anumită funcție C este numită după cum urmează: bara de picior(x,y); Scrieți codul limbajului de asamblare pentru a efectua acest apel Scrieți un program în limbaj de asamblare care ia ca intrare o expresie constând dintr-un număr întreg, un operator și un alt întreg și oferă valorile expresiilor respective ca ieșire Operatori +, -, ? Și / MULȚUMIRI - Asamblatorul la care ne referim în această aplicație face parte din Amsterdam Compiler Kit Versiunea completă a acestui set poate fi găsită la www cs vu nl/ask Suntem recunoscători oamenilor implicați în dezvoltarea sa originală: Johan Stevenson, Hans Schaminee și Hans de Vries Suntem profund datori lui Cyril Jacobs, care, în timp ce întreținea acest pachet software, l-a adaptat de mai multe ori la cererea noastră pentru uz educațional, și lui Elth Ogston, care a citit manuscrisul și a verificat exemplele și sarcinile În plus, vrem să mulțumim lui Robert van Renesse și lan-Mark Wams, dezvoltatori de trasoare pentru PDP- și, respectiv, Motorola Multe dintre ideile lor au fost luate în considerare la dezvoltarea trasorului nostru Desigur, cele mai calde cuvinte merită toți asistenții și operatorii noștri de sistem, care ne-au ajutat în predarea limbilor de asamblare de mulți ani Lista de termeni Termen folosit în carte Configurare automată autonom (informații) Registrul adreselor de memorie Așteptare activă Codul American Standard pentru Schimbul de Informații Aritmetică cu saturație Unitate logică aritmetică (ALU) Arhitectura set de instrucțiuni Linie digitală de abonat asimetrică Sistem I/O de bază reteaua de bariere Biblioteca de linkuri dinamice Otrăvire termenul original Plug and Play (PnP) deconectat Registrul de adrese de memorie (MAR) Ocupat în așteptare Codul standard american pentru schimbul de informații (ASCII) Aritmetică saturată Unitate logică aritmetică (ALU) Arhitectura set de instrucțiuni (ISA) DSL asimetric (ADSL) Sistem de intrare și ieșire de bază (BIOS) Rețele de bariere Biblioteca de linkuri dinamice (DLL) Otrăvire Bloc de preluare a comenzii Unitate de preluare a instrucțiunilor (IFU) Bloc cu virgulă flotantă Unitate în virgulă flotantă (FPU) Bloc cu simbolul inițial Bloc început prin simbol (BSS) Bloc de control Unitatea de comandă Bloc aritmetic întreg Buffer de conversie rapidă Buffer obiect de tranziție Buffer de reordonare a comenzii Buffer de urmărire a funcției de tranziție Transformați memoria tampon de stocare Registrul tampon de memorie Modul rapid de pagină Intrare ieșire I/O mapat cu memorie Procesor vectorial Partea de sus a stivei Interacțiunea componentelor virtuale Comunicarea între procese Interacțiunea componentelor periferice Mașină virtuală Java Unitate întreagă (UI) Traducere Lookaside Buffer (TLB) Bufferul țintă al ramurilor (BTB) Recomandă tampon (ROB) Urmăriți BTB Buffer de stocare a traducerii (TSB) Registrul tampon de memorie (MBR) Mod pagină rapidă (FPM) Intrare/ieșire (L/O) Mapat de memorie / Procesor vectorial Partea de sus a stivei (TOS) Virtual Component Interconnect (VCI) InterProcess Communication (IPC) Peripheral Component Interconnect (PCI) Java Virtual Machine (JVM) Lista de termeni Termen folosit în carte Termen original Mașină virtuală Java pentru numere întregi Mașină virtuală Java (IJVM) Tăiere virtuală prin rutare Fibră multithreading pe cip Latență Procesare de intrare Pagina angajată Pagina de cerere Procesare de ieșire Calcularea cu instrucțiuni paralele explicit (EPIC) Dischetă cu arhitectură Harvard Bibliotecă Hyperthreading Host Master File Table Mașter File Table (MFT) Wide Area Network (WAN) Tabel global de descriptori (GDT) Interfață grafică utilizator (GUI) Twin Descriptor de securitate Descriptor de fișier Disc RAM dinamic Disc RAM dinamic (DRAM) Cache Only Memory Access (COMA) Duplicare resurse Partajare partiționată a resurselor CD-Recordable (CD-R) Scrie după scriere (WAW) Scrie după citire (război) Scrieți alocarea Solicitare întrerupere (IR) Pagina rezervată Furtul ciclului Încuietoare Încuietoare Parte semnificativă a numărului Significand Apăsare vampir Lista de termeni Termen folosit în carte Termen original ID de securitate Matrice redundantă de discuri ieftine (independente) (RAID) Index sursă Index destinație Index Descriptor Institutul de ingineri electrici și electronici Circuit integrat (IC) sau microcip Interfață pentru sisteme de calculatoare mici Interfață de mesagerie Interfață portabilă pentru sistem de operare Interfață de memorie Registrul de informații Resecvențiere Execuție Calibrare Harta memoriei Quality of Service Cluster Cluster de stații de lucru Cod de corectare a erorilor Codare cu lungime variabilă a cuvintelor Tabel de codare a culorilor Nod de comutare Stocare de pachete și comutare directă Index sursă (SI) Index destinație (Dl) i-node Institutul de ingineri electrici și electronici (IEEE) Circuite integrate (IC) sau cip Interfață pentru sisteme de calculatoare mici (SCSI) Transfer de mesaje Interfață (MPI) Interfață cu sistem de operare portabil (POSIX) Registrul de date din memorie (MDR) Execuție în afara ordinului Ranging Harta memoriei Calitatea serviciului Cluster Cluster of Workstations (COW) Cod de corectare a erorilor (ECC) Cod de lungime variabilă Aspect culoare Up Table (CLUT) Crosspoint Stocare și redirecționare comutare de pachete Compact Disc (CD) Linker Calculator cu set complet de instrucțiuni Calculator cu set de instrucțiuni reduse Mașină cu stări finite Linker Calculator cu set de instrucțiuni complexe (CISC) Calculator cu set de instrucțiuni redus (RISC) Mașină cu stări finite (FSM) Copiere pe Write Root Hub Digital Equipment Corporation (DEC) Dual Inline Package (DIP) Cache Hit Ratio Cache Miss Rate Roșu, Verde, Albastru Raport de lovituri Rata ratat Roșu, Verde, Albastru (RGB) Lista de termeni Termen folosit în carte Termen original Cache de blocare muItithreading cu granulație grosieră Cache de urmărire Adresare bloc logic (LBA) Variabilă locală (LV) Rețea locală (LAN) Tabelul de descriptor local (LDT) Pit Mantissa Token Array Scară, indice, bază (SIB) Procesor matrice Organizația Internațională pentru Standardizare Organizația Internațională pentru Standardizare (ISO) International Open Core Protocol Consortium International Standard (IS) Internet Protocol (IP) Micro Assembly Language (MAL) Metal-oxide-Semiconductor (MOS) cu granulație fină Miliard de instrucțiuni pe secundă Milioane de instrucțiuni pe secundă Minislot Miliard de instrucțiuni pe secundă (BIPS) Milioane de instrucțiuni pe secundă (MIPS) Minislot Partajare falsă Comutare în mai multe etape Model de lucrător replicat Modul de memorie în linie dublu (DIMM) Modul de memorie inline unic (SIMM) MultiMedia eXtension (MMX) Multiplexor de acces la linie de abonat digital (DSLAM) Set de instrucțiuni vizuale (VIS) cu multiprocesor bazat pe director Fiabilitate, disponibilitate și service (RAS) Lista de termeni Termen folosit în carte Termen original Scalable Processor ARCitecture (SPARC) Nu este un număr (NaN) Nevalid, partajat, exclusiv, modificat (MESI) Acces neuniform la memorie (NUMA) Fișier imediat Flux de instrucțiuni multiple Flux de date multiple (MIMD) Flux de instrucțiuni multiple Flux de date unic (MISD) Legături implicite Procesor de semnal digital Big Endian Joint Photographic Experts Group Joint Cache Joint Test Automation Working Group Un singur disc scump Flux de instrucțiuni unic cu mai multe fluxuri de date Digital Signal Processor (DSP) Little Endian Joint Photographic Experts Group (JPEG) Cache unificat Joint Test Action Group (JTAG) ) Un singur disc mare și scump (SLED) Un singur flux de instrucțiuni Flux de date multiple (SIMD) Un flux de instrucțiuni cu un flux de date Flux de instrucțiuni unic Flux de date unice (SISD) Cameră reflex cu un singur obiectiv Acces uniform la memorie Memorie cu acces aleatoriu (informații) Memorie cu acces aleatoriu sau Memorie cu acces aleatoriu (RAM) Descriptor Reflex cu obiectiv unic (SLR) Acces uniform la memorie (UMA) Mâner pentru memorie cu acces aleatoriu (RAM) on-line Cel mai potrivit Memorie principală Open Grid Services Architecture (OGSA) Deschideți interfața controlerului gazdă (HCI) Fără acces la memorie la distanță (NORMA) Geantă de activități Interfață de pachete ATA (ATAPI) Stocare imediată a adresei (IAS) Ieșire extinsă de date (EDO) Lista de termeni Termen folosit în carte Termen original Mașină virtuală paralelă (PVM) I/O paralel Primul intrat, primul ieşit Rată dublă a datelor Intrare/ieşire paralelă (PIO) Primul intrat, primul ieşit (FIFO) Rată dublă a datelor (DDR) CD-reinscriptibil reinscriptibil (CD-RW) Comutare bară transversală Ignorare segment Redirecționare de la magazin la încărcare Asistent digital personal (PDA) Land Redenumirea registrului Bitblt Subrutină Tuning Checkerboarding Interconectare completă Amestecare completă Amestecare perfectă Partajarea completă a resurselor Strip Partajare a resurselor de prag Fork Serial ATA (SATA) Furnizor de servicii Internet (ISP) Compact Disc-Read Only Memory (CD-ROM) Memorie doar pentru citire (ROM) Stream I/O Stream Flux de date Fluxul de instrucțiuni Slot de e-mail pentru Streaming SIMD Extensions (SSE) Preambul Predicat ion Protecția siguranței Interfață de programare a aplicației (API) Memorie de atracție pentru imprimantă Lista de termeni Termen folosit în carte Termen original Slip Field Programmable Gate Array Memoria programabilă numai pentru citire Sistem de procesare a pachetelor și protocolului programabil Thread programabil Thrashing Field Programmable Gate Array (FPGA) ROM programabil (PROM) Protocol/programabil/motor de procesare a pachetelor (PPE) Thread Scanare progresivă Tehnologie avansată (AT) Lățimea de bandă bisecție Staling Protocol de scriere înapoi Protocol de transfer hipertext Protocol de coerență în cache Protocol de scriere înapoi Protocol de transfer de hipertext (HTTP) Protocol de coerență în cache Protocol de control al transmisiei (TCP) Procesor masiv paralel (MPP) Acces direct la memorie (DMA) Big endian Pachet Pachet Identificare prin radiofrecvență Paging Split cache Identificare prin radiofrecvență (RFID) Paging Split cache Distribuție de date Striping Memoria partajată distribuită (DSM) Procesare in retea Memoria intercalată Extended Industry Standard Architecture Extended ISA (EISA) Arhitectură de magistrală extinsă pentru microcontrolere Indicator de instrucțiuni extins Arhitectura magistrală de microcontroler avansat (AMBA) Registrul indicator de instrucțiuni extinse (EIP) Registrul de microinstrucțiuni (MIR) Mod de compatibilitate Integrare la scară foarte mare (VLSI) Very Long Instruction Word (VLIW) Legare gratuită a paginii Segment de legătură Lista de termeni Termen folosit în carte Termen original Server de publicitate contextuală Fermă de servere Dispozitiv de interfață de rețea Rețea rețea de stații de lucru Cuplare strânsă Fermă de servere de anunțuri Dispozitiv de interfață de rețea (NID) Rețea rețea de stații de lucru (ACUM) Cuplare strânsă Multiprocesor simetric (SMP) cuplat strâns DRAM sincron (SDRAM) Multithreading simultan Fără cache NUMA (NC-NUMA) Cache coerent NUMA (CC- NUMA) Scrie prin Twisted Nematic (TN) Cuplaj liber Loosely coupled (procesoare) Loosely coupled Snooping Cache Snooping Cuvânt de stare program (PSW) Slot de întârziere Serviciul de informare și calcul multiplexat (MULTICS) Offset Lățimea de bandă agregată Salt peste salt Consistență Exces Lățime de bandă agregată Salt peste salt Consistență Circuit integrat specific aplicației (ASIC) Lista gratuită Lista gratuită Timpul mediu dintre erori (MTBF) Referință directă Arhitectură standard industrială (ISA) RAM statică (SRAM) PROM șters (EPROM) Linii per inch Linie cache Acumulator Linii per inch (Ipi) Linie cache Acumulator Lista de termeni Termen folosit în carte Termen original Contor locație instrucțiuni Contor locație instrucțiuni (ILC) Contor program (PC) Contor de microprograme (MPC) Tabelul de bord Volum Cuprins (VTOC) Tabelul de alocare a fișierelor (FAT) Televiziune de înaltă definiție Televiziune de înaltă definiție (HDTV) Arbore gras Tranzistor cu peliculă subțire Puncte pe inch Tranzistor cu peliculă subțire (TFT) Puncte pe inch (dpi) Logica tranzistor-tranzistor (TTL) Logica tranzistor-tranzistor (TTL) Indicator de instrucțiuni flip-flop (IP) Constant Pool Pointer (CPP) Stack Pointer (SP) Indicator de fereastră curent (CWP) Indicator cadru (FP) Mod legal Universal Serial Bus (USB) Transmițător receptor universal asincron (UART) Interfață universală pentru controler gazdă (UHCI) Transmițător receptor asincron universal sincron (USART) Preîncărcarea Port grafic accelerat (AGP) Variabilă de condiție Dispozitive de controler încorporate îmbunătățite Interfață de controler gazdă îmbunătățită Dezintercalarea controlerului de întrerupere programabilă îmbunătățită IDE extins (EIDE) Interfață îmbunătățită a controlerului gazdă (EHCI) Controller de întrerupere programabil avansat (APIC) Deintercalare Dispozitiv I/O Dispozitiv I/O Dispozitiv cuplat cu încărcare (CCD) Dispozitiv cu controler integrat NT Integrated Drive Electronics (IDE) NT File System (NTFS) Sistem de fișiere structurat în jurnal Lista de termeni Termen folosit în carte Termen original Filtru Bayer Memorie flash Fragment de cioburi Biblioteca țintă Unitate centrală de procesare (CPU) Verificare redundanță ciclică (CRC) Linie digitală de abonat (DSL) Digital Video Disc Digital Versatile Disk (DVD) Digital Versatile Disk (DVD) Pinout Pinout Scanare intercalată Citire după scriere (RAW) Citiți, scrieți, executați citiți, scrieți, executați (RWX) Autobuz Sună Gateway Caii gate Calculator experimental cu tranzistori Calculator experimental cu tranzistori (TX- ) Calculator electronic cu variabile discrete (EDVAC) Memorie doar pentru citire reprogramabilă electronic EPROM electronic (EEPROM) Tub cu raze catodice (CRT) Integrator numeric electronic și întrețesere computer (ENIAC) Logica cuplată cu emițător (ECL) Legături explicite Limbajul de descriere a serviciilor web Limbajul de definire a serviciilor web (WSDL) Limbajul de marcare hipertext (HTML) Index alfabetic c , Catamount, , CCD, Codare pe / biți, CC-NUMA, , , CDC , , , , CD-R, , CD-ROM-uri, , CD-ROM XA, adresare, - CD-RW, arhitectură de instrucție, - Celeron, layout, CISC, microarhitectură, - CLUT, set de instrucțiuni, , COLOSS, registre, COMA, , semnale, CoreConnect, totalizator, COW, , tipuri de date, CPP, , formate de comandă, - CRC, , pinout, , CYMK, , D , DDR, DEC, , UN DIMM, ACL, DIP, ADSL, DLL, AGP, , DM A, AMBA, dpi, ARIS, DRAM, Apple, DSLAM, ASCII, DSM, , ASIC, DSP, ATA, ATAPI, DVD, E În ECC, BIOS, EDO, BlueGene/L, EDVAC, Blu-Ray, EEPROM, BSS, EIDE, BTB, EISA, , Burroughs B , ENIAC, Index alfabetic ENIGMA, EPIC, EPROM, Intel A, Intel A, Intel Pentium, IP, F FAT, FIFO, FMS, FORTRAN, FPGA, FPM, FPU, FSM, IPC, ISA, , , ISP, , ISR , ISR , , UI, J IOAN, G GDT, Globe, Google, GUI, , JTAG, L LAN, Latin- , LBA, LDT, H HDTV, High Sierra, HTML, HTTP, LGA, Linda, model de lucrător replicat, pachet de locuri de muncă, spațiu tuplu, IA- , IA- , - IAS, IBM, IBM , IBM , IBM , IBM , IBM , IBM , , IBM IBM PS/ , IDE, IFU, IJVM, , set de instrucțiuni, stivă, cale de date, ILC, ILLIAC, ILLIAC IV, , i-node, șablon Intel , Linux, IPi, LRU, , LV, , MAL, MAR, MBR, , MDR, MESI, MFT, Mic- , Mic- , Mic- , Mic- , Microsoft, Microsoft XBOX, MIMD, MINIX, MIPS, - MIR, MISD, MMU, Index alfabetic MMX, Motif, Motorola , MPC, MPEG- , MPI, MPP, , MTBF, MULTICS, Pentium , adresare, memorie virtuală, microarhitectură, , , micro-architecture, - mod real, registre, mod procesor virtual , PIO, N NaN, NC-NUMA, NetBurst, , NID, Nintendo GameCube, NORMA, NOW, NTFS, NUM A, , RpP, POSIX PROPE, PM, , , pthread-uri, RVM, R RAID, OCP-IP, OGSA, omega, Omnibus, OPC, Opteron, Orca, operare, spawn, fuzibil, RAM, RAS, RAW, RFID, , RAW, RFID RGB, RISC, , - ROB, ROM, s SCSI, R PC, , PCI, , PCI Express, - antet, strat link, ambalare, pachet, sarcină utilă, strat software, stivă de protocol, control flux, strat fizic, strat, PDA, , PDP- , PDP- , SDRAM, Seastar, Serial ATA, SIB, , SID, SIMD, , SIMM, SISD, SLR, SMP, SO-DIMM, Sony PlayStation , SP, SPARC, , SRAM, SSE, Sun Microsystems, Index alfabetic t WAW, TAT- / , TCP, TFT, TLB, , TLB-miss, TN, TOS, TriMedia, TSB, TX- , WEIZAC, TN, Wind , Win Win API, Win , Windows, Windows , Windows , Windows , Windows ME, și UART, UDB II, UltraSPARC I, UltraSPARC II, UltraSPARC III, adresare, memorie virtuală, UltraSPARC III Cu pipeline, , microarhitectură, UMA, UNICODE, Berry, Solaris, System V, bibliotecă principală, canale, fire de execuție de program, biblioteci țintă, Windows NT, Windows XP Manager I/O, memorie virtuală, cache, obiecte, procese și fire, dispozitiv driver, interfață grafică, sistem executiv, monitor de securitate, subsistem de mediu, servicii de sistem, sistem de fișiere, kernel, XX Windows, HZT, Cheop, UPA, USART, USB, USB , Z Zilog Z , u-conveyor, A canal de abonat, V VAX, , VCI, VIS, VLIW, VTOC, v-pipeline, cale absolută, mod auto-decrement, mod auto-increment, informații offline, inversare aditivă, adresa de memorie, , real, liniar, w WAN, WAR, adresare, , index, registru index, Index alfabetic adresare (continuare) registru index cu offset, instrucțiuni de salt, registru indirect, , imediat, , - implicit, index relativ, direct, registru, registru cu offset, moduri, spațiu de adrese, virtual, fizic, registru de adrese, Aiken Howard, , acumulator, , standby activ, indicator matrice activă, algebră boolean, circuite de relee, algoritm, ALU, , , , canal alfa, legea Amdala, modulație de amplitudine, motor analitic, memorie partajată distribuită hardware, hardware, de arbitru de magistrală, de arbitru de magistrală, argument, aritmetică cu saturație, unitate logică aritmetică, , , , arhitectură, , harvard, încărcare și salvare, computer, superscalar, linie digitală asimetrică de abonat, magistrală asincronă, , asamblator, , , , trecere de secunde, generare cod, asamblare (continuare) etichetă globală, interpret, linking, etichetă locală, mnemonice, , prima trecere, pseudo instrucțiuni, , secțiune BSS, date, text, nume simbolic, tabel de simboluri, puncte, trasoare, directivă de asamblare, program de asamblare , memorie asociativă , , John Atanasoff, B baza, sistem I/O de bază, unități de bază, registru de bază, filtru Bayer, octeți prefix, , termen, , tip de date, John Bardeen, Barrier Network, Headless Workstation, Andy Bechtolsheim, Library legături dinamice, importuri, acces multiplu, operațiuni binare, căutare binară, biți, , otrăvire, , prezență, paritate, bitmap, bitmap, lângă apel, lângă salt, Index alfabetic bloc de bază, preluări de instrucțiuni, invocări de instrucțiuni, indirecte dublă, decodare, indirecte, recurgere, alocare și înlocuire, indirecte triplă, coadă, aritmetică întregi, blocare rețele, baud, firewall modele mari, memorie firewall , Walter Brattain, algebră booleană, Bull George, buffer conversie rapidă, , preîncărcare, apel, obiecte de tranziție, reordonarea comenzilor, urme de obiecte de tranziție, de stocare de transformare, de transfer în tampon mesaje, registru tampon de memorie, element tampon fără inversare, inversat, mod rapid pagină, Babbage Charles, de ani ÎN intrare ieșire programabil, memorie mapată, acces direct la memorie, condus de întrerupere, vector de întrerupere, , procesor vectorial, registru vectorial, poartă, , , interacțiunea componentelor periferice, , interdependenţă RAW, RĂZBOIUL WAW, memorie video, hard disk, mașini virtuale, , organizare virtuală, memorie virtuală, Pentium , UltraSPARC III, rutare virtuală end-to-end, topologie virtuală, adresa virtuală spațiu, canal virtual, registru virtual, simbol extern, link extern, fragmentare externă, fragmentare internă, intraprocesor multithreading, Wozniak Steve, fibre, - octal, octal, localizare timp, interval de timp, timp latență, MTBF, de așteptări în sector, legături, ceasuri, computerizare pervazivă, asamblator de trecere de de secunde, procesare de intrare, limba de introducere, preluare, de pagini alocate, de apeluri mijloc, îndepărtat, sistem , , pagini la cerere, de supraveghetori, justificare dreapta, procesare ieșire, Index alfabetic limba de ieșire, calcul cu paralelism explicit al instrucțiunilor, centru de calculatoare, G Arhitectură Harvard, generare de coduri, dischete, hipercuburi, hyperthreading, biblioteca principală, tabelul fișierului principal, etichetă globală, rețea globală, tabel global de descriptori, curse, gradație semiton, GUI, , grup de registre de segmente, Guttenberg Johann, d apel interurban, traversare de mare distanță, program binar, sistem de numere binar, bcd, bcd, dublu, întreg dublu, dublu tor, traducător în două treceri, De Morgan, adresa validă, decodor, demultiplexor, copac, descriptor securitate, indice, dosar, , valoare zecimală, Jobs Steve, de ani Joy Bill, de ani diametrul de comunicare rețele, codificare de fază dibit, legătură dinamică, RAM dinamică, predicție dinamică a ramurilor, disc, flexibil, optic, FROM diskette, dispecer I/O, memorie virtuală, cache, obiecte, memorie, procese și fluxuri, dispecerizare, afișare TFT- cristale lichide, pe fascicul catodic tub, cu nematic răsucit, lungime de cale, cuvânt lung, întreg lung, plus până la două, la unul, cale, , acces la memorie eterogen, , omogen, numai cache, , proces copil, driver dispozitive, anvelope, fracție, duplicare resurse, duplex link, duplex modem, E unități de măsură, ȘI Cartea galbenă, partajare rigidă a resurselor, LCD afișaj, Index alfabetic antet PCI Express, TCP, Sofer de autobuz, Gate Delay, Legea Amdala, Moore, de închideri, de CD-uri înregistrabile, de înregistrări infix, invers, revers polish, single, delayed, , perpendicular, post-write, post-citire, postfix, pass-through, , fill-on-write, declanșatoare căderea semnalului, nivelul semnalului, pagini rezervate, captură de ciclu de memorie, , blocaje D- SR, - sincron, - stea, carte verde, extensie semn, semnificație, valoare octal, zecimal, hex, dinți de vampir, Zus Konrad, ȘI computer pentru jocuri, - ID de securitate, ierarhie de memorie, ieșire inversă, invertor, index sursa, destinație, fișiere, culoare indexate, , indexate, registru, registru offset, inode, registru index , indicator activ, pasiv, circuit integrat, aplicații de calculator, extra large, interval intersectorial, Hamming, interpreți, , , interpretări, interfețe dispozitive grafice, sisteme de calcul mici, mesagerie, controler gazdă deschis, universal, avansat, inregistrari infix, sectiune informativa, registru informatii, informatii autonom, operațional, IS, excepții, execuţie cu schimbare secvențe, speculative, executabile binar, binar executabil binar executabil sistem de execuție, limba sursă, operand sursă, Index alfabetic LA Internet prin cablu, - modem prin cablu, calibrare, canal, , nivel de canal, computer de buzunar, , carduri de memorie, catalog, rădăcină, curent, confirmare completă, Kildall Gary, tastatură, cluster stații de lucru, , sisteme de fișiere, computere cluster, clone, taste, carte Galben, Verde, Roșu, IZ Portocaliu, Cod BCD, corectare erori, operații, Reed-Solomon, caractere, modificări alfabetice, condiții, Hamming, Codare pe / biți, pagini de coduri, tabel de coduri de culori, de cuvinte de cod, segment de cod, colector, tampon inel, inel, echipă I/O, preluare, decodare, vizuale, execuție, mișcări, echipa (continuare) comparații, salt condiționat, circuit combinatoriu, comunicator, rețea de comunicații, diametru, factor de ramificare, dimensiune , grad de nod , nod de comutare , comutare cu conservare și pachete promoționale, CD, FROM inscriptibil, multisesiune, reinscriptibil, sector, cadru, comparator, compilator, , layout dinamic, implicit, explicit, linker, , linker loader, computer jocuri, - buzunar, , cluster, invizibil, - acțiune paralelă, personal, - cu set de instrucțiuni complet, , cu set de instrucțiuni redus, , calculator arhitectura, organizare, transportor, Pentium simplu, model de conductă , mașină de stat , tranziție, stare, constantă redistribuire, context, Index controlor intrare-ieșire, disc, secvențe, întreruperi, program de control, punct de control, hub, copiere la scriere, director rădăcină, hub rădăcină, carcasă cu două capete, tuplu, registru indirect, , Kosla Winold, cache hit rate, cache rates, furks, red book, IZ Cray Seymour, critic section, coarse multithreading, cube, cache blocuri, de date, de scrieri, de preluare, de urmărire, de consistență, de urme, stocarea în cache invalidarea datelor, strategie de actualizare, cache, , , P-input asociativ, de nivel secund, de completare de scriere, de accesare cache, de pierdere de cache, de writeback, de grupare, de write-back, de cartografiere directă, de împărțire, , de write-through, L imprimantă laser, valoare stângă, adresa bloc liniară, adresa liniară, linie de comunicare abonat, duplex, simplex, literal, Lovelace Ada, logic negativ, pozitiv, intrare logică, locație temporal, spațial, etichete locale, rețele locale, tabele de descriptori locali, puțuri, m disc magnetic, McNeely Scott, macro arhitectură, macro invocare, macro definiție, macro extindere, macro, sistem de operare, parametri reali, parametri formali, model de memorie mică, mantisa, jeton de acces, , router, rutare virtual, de la la masca canal alfa, în operațiuni binare, sistem scalabil , scalabilitate , multicomputer scalabil , placă de bază , imprimantă cu matrice de puncte , procesor cu matrice de puncte , Index alfabetic mașină analitice, virtuale, diferențe, von Neumann, , limbaj mașină, , interval intersector, protocol gateway, multithreading cu granulație fină, etichetă, global, local, microasamblare, microdisc, microinstrucțiuni, microcontroler, - microops, microprogram, , , microprogramare, cipuri, RFID, procesoare, modele de memorie miniaturală, mini-sloturi, Myhrvold Nathan, mnemonice, , partiții imaginare, multithreading în procesor, cu granulație grosieră, cu granulație fină, sincron, CD cu mai multe sesiuni, organizare computer pe mai multe niveluri, model memorie mari, mici, în miniatură, viabile, lucrători replicați, modemuri ADSL, duplex, cablu, half duplex, modul obiect, memorie modul (continuare) cu două capete, cu pinout pe o singură față, modulare, amplitudine, faza, frecvență, monitor securitate, cu tub catodic, montaj SAU, MOP, Moshley John, de ani multicomputer categorii, scalabil, definiție, , magistrală multiplex, multiplexor, multiprogramare, multiprocesor, , , , bazat pe catalog, simetric, Moore Gordon, , de ani șoarece, mutex, mainframe, - n arhitectura procesorului scalabil, nu un număr, transmiterea mesajului neblocant, retea neblocante, computer invizibil, - logica negativa, numere nenormalizate, accesuri neuniforme la memorie, , adresare directă, , - operand imediat, fișier imediat, semnal purtător, adresare implicită, legarea implicită, Noyce Robert, , de ani Index număr normalizat, secțiunea statutară, DESPRE zona de proceduri, de piele, de tratamente intrare, ieșire, semitonuri, procesor excepții, întreruperi, semnale digitale, writeback, reverse polish, backward compatibility, big endian, , pooled cache, object program, object module, , object file, table of overlay, conținut, flux de instrucțiuni unice cu fluxuri de date multiple, scriere o dată, secțiune de de biți, acces uniform la memorie, RAM, fereastră de registru, rotunjire, Kennet Olsen, operanzi sursă, imediată, țintă, informații operaționale, memorie operațională, dinamic, static, sistem de operare, , operare, , binar, unar, descriptori, sondaje, cele mai potrivite, discuri optice, IM carte portocalie, bază radix, arhitectură deschisă de servicii de calcul distribuite, interfață de controler gazdă deschisă, colector deschis, write-back, , adresare index relativ, eroare relativă, cale relativă , coadă de mesaje , eroare pagina lipsește, depășiri, depășiri, P pachet, , , antet, de locuri de muncă, de confirmări, de încărcări utile, de rafale, de memorie, , asociativ, , virtual, actualizare, operaționale, permanente, atrăgătoare, stratificate, cu opțiuni avansate de ieșire, manager, memorie flash, paralelism la nivel de echipă, la nivel de procesor, de mașini virtuale paralele, de I/O paralele, de parametri actual, formală, Pascal Blaise, de ani indicator de matrice pasivă, Patterson David, de ani RAP, prima trecere a asamblatorului, Index alfabetic transmitere de mesaje în buffer, neblocare, sincron, CD-reinscriptibil, deformare magistrală, comutare încrucișată, suprapunere de segmente, redirecționare descărcare, captură excepție, tranziție scurtă, departe, mașină de stat, perioada de asteptare, autobuz periferic, inregistrare perpendiculara, computer personal, - secretar electronic personal, ROM, , pixeli, floatoare, pad-uri, computerizare omniprezentă, înlocuire de registre, subrutine, , subsistem mediu, tuning, bus slave, ridicare, logica pozitivă, logica, dependentă de program căutare, defalcare celulară, sarcină utilă, politică de umplere, interconectare completă, de amestecare completă, de strângere de mână completă, de partajare completă a resurselor, de poartă completă, de adăugare completă, de bandă, de ciugături, modem semi-duplex, jumătate combinator, mod utilizator, prag de partajare a resurselor, care generează un nou proces, ordine de de octeți invers, , direct, serial, ISP, ROM, pe CD, programabil, șters, reprogramabil electronic, scriere postfix, curgere intrare-ieșire, date, comenzi, software, , control, consumator, slot de e-mail, preambul, predicție, întrerupere, , inexact, precis, prefix, de octeți de prefix, , privilegiați utilizator, modul, receptor bus, transceiver universal asincron, sincron-asincron, anvelope, aplicate programator, interfață software, imprimantă, laser, matrice, cu cerneală de ceară, cerneală solidă, jet, principiu RISC, localitate, , atragerea memoriei, Index alfabetic problemă link extern, realocări de memorie, consistență în cache, thrashing, predicție de ramuri, dinamic, static, program, binar, executabil, control, limbaj de asamblare, manipulare întreruperi, , obiect, independent de poziție, automodificabil, programabil matrice de porți, matrice logică, memorie doar pentru citire, I/O programabile, controler de întrerupere programabil, programator aplicat, programator de sistem, software, flux de programe, , nivel de program, progresiv, transparență, producător, prolog proceduri, lățime de bandă procesor, secțiune transversală, cumulativ, medie, schemă COMA simplă, simplă, , localizare spațială, spațiu adresa, tupluri, protocol, , internetwork, scriere o dată, rescriere, transmisie hipertext, protocol (continuare) negociere cache, control transmisie, autobuze, trecere de asamblare, proceduri, , procese copil, părinte, procesor vector, matrice, masiv paralel, , rețea, cu cuvânt de comandă foarte lung, central, consistență procesor, adresare directă, acces direct la memorie, , little endian, pseudo-instrucțiuni, , , cale, absolut, relativ, pachet, R set de lucru, - măturare progresiv, întrețesut, descărcarea memoriei RAM, sectiunea informativa, normativ, partajare dificilă a resurselor, plin, prag, cache partajată, , dimensiuni rețele de comunicații, motor de diferențe, alocare de discuri, memorie partajată distribuită, , arhitectură de servicii de calcul distribuite, organizare virtuală, Index alfabetic definiție de calcul distribuit (continuare), nivelul infrastructură, colective, aplicații, resurse, memorie stratificată, bitmap, extensie opcode, arhitectură standard industrială extinsă, interdependență reală, mod real, registru, , , , vector virtual de bază, , index, cod de condiție, instrucțiune, microinstrucțiuni, scop general, memorie adresa, buffer, date, sumator, contor, pointer, flag, , adresare registru, adresare registru offset, fereastra registru, linker, mod auto-decrement, auto-increment, adresare, paginare rapidă, vcpu, lot, utilizator, privilegiat, real, procedură recursivă, recursivitate, grilă, risc, proces-mamă, Cu program de auto-modificare VLSI, , resetare semnal, VLSI, LED, solvabilitate liberă, pagină liberă, link, registru cu deplasare dinamică tranziții, segment, , date, suplimentare, machete, consistență secvențială, Sequen Carlo, sector, secțiune BSS, date, texte, semafore, familii de microcontrolere MSC- , server, fermă de servere, sesiune, dispozitiv de interfață de rețea, procesor de rețea, mesh, rețea barieră, blocare, globală, comunicare, locală, neblocare, stație de lucru, multietapă, semnal purtător, resetare, control, instalare, Index alfabetic procesoare strâns cuplate, nume simbolice, multiprocesor simetric, simplex link, sincron D-latch, sincron S R-latch, sincron DRAM, multithreading sincron, mesagerie sincronă, magistrală sincronă, sincron-asincron transceiver, sistem în execuție, scalabil, operațional, interogare secvențială, partajare a timpului, memorie partajată, memorie partajată, calcul octal, binar, hex, fișier, service de sistem, magistrală de sistem, apel de sistem, , interfață de sistem, programator de sistem, write-through, , nematic răsucit, consistență slabă, procesoare cuplate slab, cache de urmărire, urmărire, cuvânt, , cod, de stări de program, , , slot amânări, poștal, serviciul de informare generală și informatică, offset, eveniment, debitul total abilitate, consistență cache, priză, corutine, coprocesor, co-inginerie, state, curse, computer, mașină cu stări finite, consistență procesor, gratuit, secvenţial, slab, strict, descărcare speculativă, execuție speculativă, ASIC, listă control acces, memorie liberă, splitter, lățime de bandă medie, legături directe, eroare standard, arhitectură standard industrială, , intrare standard, ieșire standard, operațională statică memorie, predicție statică crengi, stive operanzi, - , variabile de procedură, adresare stivă, cadru stivă, grade nod, Stibits George, memorie programabilă doar pentru citire ștergabilă, pagina, dedicat, rezervat, gratuit, organizarea paginii memorie, cadru de pagini, scaner de pagini, Index alfabetic strategie actualizări, de invalidare a datelor, de intrare, de consistență strictă, de linii cache, , , de memorie principală, de scanări, de jet de cerneală, de bule, de piezoelectrice, de termice, de sublimare, , de sublimare , plin, jumatate de adunare, carry select, carry through, supercomputer, , arhitectura superscalar, - circuit integral, combinatoriu, schimburi, tejghea adrese, adrese de instrucțiuni, instrucțiuni, , , , firmware, accesări, T masa vectori de întrerupere, fișier principal, descriptori global, local, expedieri, adevăruri, TOC, salturi, locații fișiere, caractere, , , pagini, , traduceri, culori, generator de ceas, directorul curent, televiziune de înaltă definiție, terminal , tip de date octet, BCD, cuvânt lung, nenumeric, cuvânt, numeric, jeton, arbore gras, tranzistor cu peliculă subțire, topologie, , Torvalds Linus, punct intrare, control, salvări, calea datelor, , , tranzacții, tranzistor, bipolar, MOP, TTL, ESL, transceiver autobuz, translator, transmisie, tracer, flip-flop, TTL, Wilkes Maurice, de ani indicator, baze, înregistrări, cod, comenzi, , teanc, cadru, lecturi, operare unară, magistrale vechi, magistrală serială universală, transceiver asincron universal, Index alfabetic interfață universală pentru controler gazdă, control flux, memorie control, prefatch, nivel, abstracții hardware, arhitecturi de set instrucțiuni, , , asamblatori, infrastructuri, canale, colective, microarhitecturi, , , microprogramari, sisteme de operare, , aplicații, software, resurse fizice, tranzacții, dispozitive fizice, , logică digitală, , porturi grafice accelerate, variabile de condiție, execuție condiționată, interfață avansată de controler gazdă, controler avansat de întrerupere, set de semnale, date învechite, dispozitive aritmetică-logică, , I/O, memorie, scanare raster, cuplate cu încărcare, tri-state, interfață de rețea, controler integrat, magistrală stăpân, sclav, f modulare de fază, fișiere, executabil, fișier (continuare) imediat, obiect, sistem de fișiere, FAT, N T parametru real, strat fizic, spațiu de adresă fizică, filtru Bayer, optice, software, steag de direcție, transport deasupra capului, paritate, registru steag, , Clasificare Flynn, memorie flash, von Neumann, John, computer von Neumann, , parametru formal, fragment de index, fragmentare extern, intern, cadrul variabilelor locale, , X butuc, Hamming Richard, de ani Turnul din Hanoi, , Hoagland Al, hashing, c paleta de culori, scară de culori, bibliotecă țintă, operand țintă, limbă țintă, întreg dublu, lung, CPU, , ciclu fetch-execute, de căi de date, Index alfabetic ciclu (continuare) anvelope, eficient, verificare de redundanță ciclică, , cilindru, linia digitală de abonat, cameră digitală, - nivel logic digital, , pinouts, CPU, h decodificare parțială adrese, frecvență manipulare, modulație de frecvență, cerneală pe bază de vopsea, pe bază de pigment, număr precizie finită, nenormalizat, normalizat, semnat, dublă precizie, întrețesut, citit după scriere, w model, hexazecimal, valoare hex, autobuz, , , , AGP, , EISA IBM RS, ISA, - PCI, semnale, tranzacții, USB, asincron, , magistrală (continuare) multiplex, periferic, protocol, procesor, registre dispozitiv, sincron, sistem, moștenit, lățime magistrală, serviciu în bandă largă, criptare cheie publică, cheie simetrică , gateway de apel , Shockley William, Shughart Howard, uh echivalență circuit, Eckert J Presper, exponenți, EEPROM, tub catodic, CRT, emițător, epilog proceduri, ESL, Estridge Philip, efect pieptene, ciclu efectiv, eu legături explicite, nuclee, , limbi asamblator, , , intrare, nivel înalt, ieșiri, sursă, mașină, , țintă, memorie, Andrew Tanenbaum Arhitectura computerului (+CD) editia a -a Tradus din engleză de Y Gorokhovsky, D Shinshyakov Editorial A Krivtsov Manager de proiect V Shachin Editor științific E Bochkareva Editori Artisti corectori Aspect Yu Gorokhovsky, A Zhdanov L Adu ponderat I Smirnova, I Timofeeva Yu, Sergienko Semnat pentru publicare la Format x / Conv p l , Tiraj Ordinul SRL "Piter Press", , Sankt Petersburg, autostrada Petergofskoe, , lit A Beneficiu fiscal - clasificator integral rusesc al produselor OK - , volumul ; - literatură educaţională Imprimat folosind tehnologia CtP la OAO Printing Yard im A M Gorki , Sankt Petersburg, pr Chkalovsky, ARHITECTURA CALCULATORULUI EDIȚIA A V-A E TANENBAUM Despre CD-ROM FURNIZAT PH PTR PETRU E TANENBAUM ARHITECTURA CALCULATORULUI EDIȚIA A V-A CĂRȚI CARE NU ÎMBĂTRÂNesc NICIODATĂ! CLASSICS COMPUTEA SCIENCE Cartea lui Andrew Tanenbaum, un specialist IT, scriitor și profesor de renume mondial, este acum la a cincea ediție și este dedicată organizării structurale a unui computer Se bazează pe ideea unei structuri ierarhice, în care fiecare nivel îndeplinește o funcție bine definită În cadrul acestei abordări neconvenționale, nivelul de logică digitală, nivelul arhitecturii de instrucțiuni, nivelul sistemului de operare și nivelul limbajului de asamblare sunt descrise în detaliu Cartea este destinată unei game largi de cititori - de la studenți care studiază tehnologia computerelor, celor care se familiarizează în mod independent cu arhitectura unui computer CD-ROM INCLUS ^PPTER Comanda de carte: , St Petersburg, PO Box tel : ( ) - - , postbook@piter com , Harkiv- , PO Box tel: ( ) - - , piter@kharkov piter com www piter com - toate informațiile despre cărți și magazinul online ISBN - - - 